Aprendizado por reforço utilizando tile coding em cenários multiagente
dc.contributor.advisor | Bazzan, Ana Lucia Cetertich | pt_BR |
dc.contributor.author | Waskow, Samuel Justo | pt_BR |
dc.date.accessioned | 2011-03-31T06:00:03Z | pt_BR |
dc.date.issued | 2010 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/28349 | pt_BR |
dc.description.abstract | Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. | pt_BR |
dc.description.abstract | Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one. | en |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Artificial intelligence | en |
dc.subject | Sistemas multiagentes | pt_BR |
dc.subject | Multiagent systems | en |
dc.subject | Reinforcement learning | en |
dc.subject | Agentes inteligentes | pt_BR |
dc.subject | Function approximation | en |
dc.title | Aprendizado por reforço utilizando tile coding em cenários multiagente | pt_BR |
dc.title.alternative | Reinforcement learning using tile coding in multiagent scenarios | en |
dc.type | Dissertação | pt_BR |
dc.identifier.nrb | 000769941 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2010 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Files in this item
This item is licensed under a Creative Commons License
-
Exact and Earth Sciences (5129)Computation (1764)