Navegação TCC Ciência da Computação por Autor "Silva, Bruno Castro da"

Active selection of continuous training tasks to learn generalizable policies

Eidelwein, Júlia (2021) [Trabalho de conclusão de graduação]

A key challenge when deploying reinforcement learning (RL) algorithms in robotics set tings is the large number of interactions between the agent and its environment that are necessary for an optimal behavior to be learned. ...

Applying bandit algorithms to the route choice problem

Oliveira, Thiago Bell Felix de (2017) [Trabalho de conclusão de graduação]

Traffic infrastructure in major cities must be able to handle increasing demand. Building this infrastructure is expensive and not something that is done in a short time frame. Bottlenecks in the network and potential ...

BARBELL : um Framework para modelagem e simulação de ambientes de aprendizado por reforço

Lopes, Henrique de Paula (2019) [Trabalho de conclusão de graduação]

Métodos de aprendizado por reforço tratam de problemas que compreendem uma subárea da inteligência artificial onde um agente, inserido dentro de um ambiente, tenta solucionar um determinado problema através de uma sequência ...

A comparison of recommender systems for crowdfunding projects

Benin, Adriano Carniel (2018) [Trabalho de conclusão de graduação]

Recommender systems have been a popular research topic in the field of Machine Learning and are of great commercial interest for many businesses. This work aims to implement and evaluate different recommendation strategies ...

Explorando os limites da análise de sentimentos como ferramenta para inferência automática de eventos relacionados à pandemia COVID-19 no Brasil

Freitas, Pietra Thamy Sofia da Fonseca (2021) [Trabalho de conclusão de graduação]

Análise de sentimentos é uma das áreas de aprendizado de máquina que se destaca frente ao entendimento dos efeitos da pandemia COVID-19 na população. O presente trabalho se propõe a abordar as limitações da análise automática ...

Generalização do comportamento de robôs usando regressão de manifolds

Garcia, Rafael (2016) [Trabalho de conclusão de graduação]

Algoritmos de aprendizado de máquina podem ser muito custosos computacionalmente, em particular aqueles utilizados em tarefas na área de robótica, especialmente quando um número muito grande de tarefas de treinamento ...

Identifying Reusable Early-Life Options

Weber, Aline (2020) [Trabalho de conclusão de graduação]

We introduce a method for identifying short-duration reusable motor behaviors, which we call early-life options, that allow robots to perform well even in the very early stages of their lives. This is important when agents ...

Improving black-box speech-to-text systems via machine learning techniques

Schwade, Guilherme Vieira (2016) [Trabalho de conclusão de graduação]

There are several ways a user can interact with a computer. Not every way is equally appropriate for all situations: when typing, a keyboard is more appropriate; a mouse, on the other hand, is a better fit in case the user ...

Incremental learning applied to streaming environments

Reis, Alister Machado dos (2017) [Trabalho de conclusão de graduação]

A necessidade de extrair conhecimento a partir de dados está presente em muitos campos e sob variadas formas. Um exemplo é quando precisa-se tratar fluxos de dados, sejam eles provenientes de sensores, redes sociais, ou ...

Um método de ataque adversarial a redes neurais convolutivas para reconhecimento facial

Biff, Lucas da Silva (2019) [Trabalho de conclusão de graduação]

Atualmente, as tecnologias de redes neurais permitem realizar atividades de reconhecimento facial com uma precisão nunca vista antes. Reconhecimento facial está sendo usado para fins de mídia social, para, por exemplo, ...

Minimum delay adaptation in non stationary reinforcement learning via online high confidence change point detection

Alegre, Lucas Nunes (2020) [Trabalho de conclusão de graduação]

Non-stationary environments are challenging for reinforcement learning algorithms. If the state transition and/or reward functions change based on latent factors, the agent is effectively tasked with optimizing a behavior ...

O-MuZero : abstract planning models Induced by Options on the MuZero Algorithm

Jacobi, Otavio Flores (2021) [Trabalho de conclusão de graduação]

Training Reinforcement Learning agents that learn both the value function and the envi ronment model can be a very time consuming method, one of the main reasons for that is that these agents learn by actions one step at ...

Predicting response quality as a proxy of fatigue via eye tracking and EEG

Dambros, Gustavo Vergani (2017) [Trabalho de conclusão de graduação]

Many computer systems are capable of adapting their behavior depending on the degree of fatigue of their users, so it is of interest to estimate how tired users are. As there is no method to measure user fatigue directly, ...

ROBiT : um método de detecção de plágio baseado em otimizações de arquivos binários

Robert, Roberta (2024) [Trabalho de conclusão de graduação]

O aumento significativo da utilização de plataformas remotas de ensino de programação desde a crise do COVID-19, aliado aos recentes progressos na área de Inteligencia Artificial (IA) generativa, trouxeram novos desafios ...