Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística
dc.contributor.advisor | Engel, Paulo Martins | pt_BR |
dc.contributor.author | Settin, Jorel | pt_BR |
dc.date.accessioned | 2011-03-04T05:59:43Z | pt_BR |
dc.date.issued | 2010 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/27974 | pt_BR |
dc.description.abstract | Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de simulações do problema, mínima necessidade de prévia especificação de parâmetros de treinamento, adaptabilidade a diversas classes de problemas, ter um comportamento determinístico para obter soluções com a mínima complexidade necessária, e de baixo custo computacional. Compara-se o desempenho do algoritmo proposto às técnicas utilizadas no atual estado da arte, em problemas de controle de sistemas físicos, e outros comumente utilizados como teste de desempenho. | pt_BR |
dc.description.abstract | This work analyzes the main techniques for training neural networks in reinforcement learning problems, and finally proposes a new algorithm using their best features, and besides, utilizing meta-optimization based on statistical sampling. The study aims to obtain a method with a high rate of success, low number of the simulated problem evaluations, minimal needs of prior training parameters specification, adaptability to different problem classes, deterministic behavior for obtaining minimal complexity solutions, and low computational cost. The performance of the new algorithm is compared to the main techniques used in state of the art, in problems of physical system control and other usual benchmarks. | en |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Redes neurais | pt_BR |
dc.subject | Statistical meta-optimization. | en |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Reinforcement learning | en |
dc.subject | Neural network training | en |
dc.subject | Neural network architecture | en |
dc.subject | Simulated annealing | en |
dc.subject | Genetic algorithms | en |
dc.subject | Evolutionary algorithms | en |
dc.subject | Cascaded neural networks | en |
dc.title | Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística | pt_BR |
dc.title.alternative | A reinforcement learning algorithm for neural networks using statistical meta optimization | en |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 000767659 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2010 | pt_BR |
dc.degree.graduation | Engenharia de Computação | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License

-
TCC Engenharias (5960)