• Análise da hierarquia de memórias em GPGPUs 

      Conrad, Danilo Fukuda (2010) [Trabalho de conclusão de graduação]
      O uso de placas gráficas como elementos de co-processamento para obter alto desempenho em aplicações paralelas tem crescido cada vez mais nos últimos tempos. Diversos são os exemplos de aplicações que, fazendo uso dessas ...
    • Análise de desempenho da arquitetura CUDA utilizando os NAS parallel benchmarks 

      Pilla, Laercio Lima (2009) [Trabalho de conclusão de graduação]
      Processadores gráficos vêm sendo utilizados como aceleradores paralelos para computações de propósito geral (GPGPU), não detidos mais apenas em aplicações gráficas. Isto acontece devido ao custo reduzido e grande potencial ...
    • Cloud Computing para deploy de modelos de Deep Learning para a detecção de Retinopatia Diabética 

      Camargo, Matheus Woeffel (2023) [Trabalho de conclusão de graduação]
      A incidência de diabetes está aumentando a um ritmo alarmante em todo o mundo. Por consequência, crescem os casos de retinopatia diabética (RD), uma complicação da di abetes que em sua forma mais grave pode levar à cegueira. ...
    • Desenvolvimento de memórias scratchpad para arquiteturas multi-core 

      Moreira, Francis Birck (2011) [Trabalho de conclusão de graduação]
      Durante a execução de programas paralelos em arquiteturas com múltiplos núcleos, diversas vezes torna-se necessária a manipulação de uma quantidade razoável de dados compartilhados entre as múltiplas threads paralelas, as ...
    • Distributed near real-time processing of sensor network data flows for smart grids 

      Carvalho, Otávio Moraes de (2015) [Trabalho de conclusão de graduação]
      Sensor networks have become ubiquitous, ranging from personal mobile phones to smart grids, and are producing each time higher amounts of data, in ever shorter time intervals. Distributed event stream processing systems, ...
    • Expansão da arquitetura de conjunto de instruções MIPS para suporte à robótica 

      Cruz, Vicente Silva (2009) [Trabalho de conclusão de graduação]
      Arquitetura de computadores é uma área que tem se desenvolvido muito nos últimos anos, e as pesquisas são cada vez mais crescentes. Os avanços tecnológicos atuais nos permitem processar grandes quantidades de dados em pouco ...
    • Implementação em gpu da transformada de legendre 

      Camaratta, Eduardo Dias (2009) [Trabalho de conclusão de graduação]
      Ao se aproximar dos limites físicos para a produção de chips, a indústria de hardware necessita enfrentar uma série de problemas para tentar manter os ganhos de desempenho vistos ao longo das últimas décadas. Assim, a ...
    • Parallel implementations of the cholesky decomposition on CPUs and GPUs 

      Ruschel, João Paulo Tarasconi (2016) [Trabalho de conclusão de graduação]
      As Central Processing Units (CPUs) and Graphical Processing Units (GPUs) get progressively better, different approaches and designs for implementing algorithms with high data load must be studied and compared. This work ...
    • Simulação e avaliação de desempenho de arquiteturas paralelas utilizando a ferramenta Simics 

      Silveira, Maurício Machado (2008) [Trabalho de conclusão de graduação]
      Desde os primórdios da computação tem-se ciência de que o processamento paralelo e o paralelismo em geral aumentam o desempenho de execução das aplicações e tornam as máquinas mais rápidas. Desta forma, muitas técnicas e ...
    • A Study of the prefetcher impact on high-performance computing applications 

      Girelli, Valeria Soldera (2021) [Trabalho de conclusão de graduação]
      Data prefetching algorithms are widely used in modern processors as a tool to mitigate the higher latency of memory accesses with respect to processor latency to execute instructions. However, understanding the contribution ...