• Aprendizado por reforço em ambientes não-estacionários 

      Silva, Bruno Castro da (2007) [Dissertação]
      Neste trabalho apresentamos o RL-CD (Reinforcement Learning with Context Detection), um método desenvolvido a fim de lidar com o problema do aprendizado por reforço (RL) em ambientes não-estacionários. Embora os métodos ...