Aprendizado em sistemas multiagente através de coordenação oportunista.

Oliveira, Denise de

dc.contributor.advisor	Bazzan, Ana Lucia Cetertich	pt_BR
dc.contributor.author	Oliveira, Denise de	pt_BR
dc.date.accessioned	2010-11-25T04:21:34Z	pt_BR
dc.date.issued	2009	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/26857	pt_BR
dc.description.abstract	O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centralizada não é praticável em grandes espaços de estado-ação, um modode reduzir a complexidade do problema é decompô-lo em subproblemas utilizando cooperação entre agentes independentes em algumas partes do ambiente. No método proposto, agentes independentes utilizam comunicação e um mecanismo de cooperação que permite que haja expansão de suas percepções sobre o ambiente e para que executem ações cooperativas apenas quando é melhor que agir de modo individual. O OPPORTUNE foi testado e comparado em dois cenários: jogo de perseguição e controle de tráfego urbano.	pt_BR
dc.description.abstract	The size of the representation of joint states and actions is a key factor that limits the use oh standard multiagent reinforcement learning algorithms in complex problems. This work proposes opportunistic Coordination Learning (OPPORTUNE), a multiagent reinforcement learning method to cope with large scenarios. Because a centralized solution becomes impratical in large state-action spaces, one way of reducing the complexity is to decompose the problem into sub-problems using cooperation between independent agents in some parts of the environment. In the proposed method, independent agents use communication and cooperation mechanism allowing them to extended their perception of the environment and to perform cooperative actions only when this is better than acting individually. OPPORTUNE was tested and compared in twm scenarios: pursuit game and urban traffic control.	en
dc.format.mimetype	application/pdf
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Inteligência artificial	pt_BR
dc.subject	Multiagent systems	en
dc.subject	Reinforcement learning	en
dc.subject	Sistemas multiagentes	pt_BR
dc.subject	Coordination	en
dc.subject	Cadeias : Markov	pt_BR
dc.title	Aprendizado em sistemas multiagente através de coordenação oportunista.	pt_BR
dc.title.alternative	Towards joint learning in multiagent systems through oppotunistic coordination	en
dc.type	Tese	pt_BR
dc.identifier.nrb	000759645	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Computação	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2009	pt_BR
dc.degree.level	doutorado	pt_BR

Ficheros en el ítem

Nombre:: 000759645.pdf
Tamaño:: 1.817Mb
Formato:: PDF
Descripción:: Texto completo

Ver

Este ítem está licenciado en la Creative Commons License

Ciencias Exactas y Naturales (5129)

Computación (1764)

Mostrar el registro sencillo del ítem