Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística
Visualizar/abrir
Data
2010Autor
Orientador
Nível acadêmico
Graduação
Outro título
A reinforcement learning algorithm for neural networks using statistical meta optimization
Assunto
Resumo
Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de simulações do problema, mínima necessidade de prévia especificação de parâmetros de treinamento, adaptabilidade a diversas classes de problemas, ter um ...
Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de simulações do problema, mínima necessidade de prévia especificação de parâmetros de treinamento, adaptabilidade a diversas classes de problemas, ter um comportamento determinístico para obter soluções com a mínima complexidade necessária, e de baixo custo computacional. Compara-se o desempenho do algoritmo proposto às técnicas utilizadas no atual estado da arte, em problemas de controle de sistemas físicos, e outros comumente utilizados como teste de desempenho. ...
Abstract
This work analyzes the main techniques for training neural networks in reinforcement learning problems, and finally proposes a new algorithm using their best features, and besides, utilizing meta-optimization based on statistical sampling. The study aims to obtain a method with a high rate of success, low number of the simulated problem evaluations, minimal needs of prior training parameters specification, adaptability to different problem classes, deterministic behavior for obtaining minimal c ...
This work analyzes the main techniques for training neural networks in reinforcement learning problems, and finally proposes a new algorithm using their best features, and besides, utilizing meta-optimization based on statistical sampling. The study aims to obtain a method with a high rate of success, low number of the simulated problem evaluations, minimal needs of prior training parameters specification, adaptability to different problem classes, deterministic behavior for obtaining minimal complexity solutions, and low computational cost. The performance of the new algorithm is compared to the main techniques used in state of the art, in problems of physical system control and other usual benchmarks. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Engenharia de Computação.
Coleções
-
TCC Engenharias (5855)
Este item está licenciado na Creative Commons License