Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística

Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de simulações do problema, mínima necessidade de prévia especificação de parâmetros de treinamento, adaptabilidade a diversas classes de problemas, ter um comportamento determinístico para obter soluções com a mínima complexidade necessária, e de baixo custo computacional. Compara-se o desempenho do algoritmo proposto às técnicas utilizadas no atual estado da arte, em problemas de controle de sistemas físicos, e outros comumente utilizados como teste de desempenho. ...

Abstract

This work analyzes the main techniques for training neural networks in reinforcement learning problems, and finally proposes a new algorithm using their best features, and besides, utilizing meta-optimization based on statistical sampling. The study aims to obtain a method with a high rate of success, low number of the simulated problem evaluations, minimal needs of prior training parameters specification, adaptability to different problem classes, deterministic behavior for obtaining minimal c ...

Instituição

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Engenharia de Computação.

Coleções

Trabalhos de Conclusão de Curso de Graduação (38448)

TCC Engenharias (5990)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License