Mostrar registro simples

dc.contributor.advisorAzambuja, José Rodrigo Furlanetto dept_BR
dc.contributor.authorPietta, Enzo Victor Zucchettipt_BR
dc.date.accessioned2025-01-31T06:55:40Zpt_BR
dc.date.issued2025pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/284236pt_BR
dc.description.abstractEste trabalho investigou o desempenho de Redes Neurais Convolucionais (CNN) aplicadas à classificação de imagens em três plataformas de hardware distintas: CPU, GPU e FPGA. Para isso, foram utilizados três conjuntos de dados (MNIST, CIFAR-10 e SAT 6), cada um associado a uma rede neural específica. Inicialmente, implementaram-se modelos em precisão total, executados na CPU e GPU, e, em paralelo, desenvolveu se uma versão quantizada dessas redes para implementação em FPGA por meio do framework FINN. As principais métricas de avaliação contemplaram acurácia, latência, vazão e dissipação de potência, possibilitando uma análise abrangente de desempenho. Os resultados indicaram que a GPU se sobressai em termos de vazão, sobretudo em cenários com lotes grandes, graças ao processamento maciço e paralelo. No entanto, apresenta dissipação de potência mais elevada e sofre com latências maiores para lotes unitários, em função dos custos de transferência de dados. Já a CPU obteve latências baixas para inferências individuais, mantendo um consumo energético intermediário e um desempenho adequado para aplicações que não exigem alta taxa de processamento simultâneo. A implementação em FPGA, por sua vez, demonstrou vantagens em cenários que priorizam eficiência energética e latências mais previsíveis, especialmente em lotes pequenos. Mesmo com as limitações de recursos e a necessidade de quantização, o hardware reconfigurável alcançou acurácias semelhantes aos modelos em precisão total, evidenciando o potencial do FINN para acelerar redes neurais embarcadas. Assim, a escolha da plataforma mais apropriada depende dos requisitos específicos de cada aplicação, balanceando aspectos de velocidade, consumo de energia e complexidade do projetopt_BR
dc.description.abstractThis work investigated the performance of Convolutional Neural Networks (CNNs) applied to image classification on three distinct hardware platforms: CPU, GPU, and FPGA. To achieve this, three datasets (MNIST, CIFAR-10, and SAT-6) were used, each associated with a specific neural network. Initially, full-precision models were implemented and executed on the CPU and GPU. Simultaneously, a quantized version of these networks was developed for FPGA implementation using the FINN framework. The main evaluation metrics included accuracy, latency, throughput, and power dissipation, enabling a comprehensive performance analysis. The results indicated that the GPU excelled in terms of throughput, particularly in scenarios with large batch sizes, due to its massive parallel processing capabilities. However, it exhibited higher power dissipation and faced increased latency for single-batch inferences due to data transfer overhead. The CPU, on the other hand, achieved low latencies for individual inferences, maintained intermediate energy consumption, and delivered adequate performance for applications not requiring high simultaneous processing rates. The FPGA implementation demonstrated advantages in scenarios prioritizing energy efficiency and more predictable latencies, especially with small batch sizes. Despite resource limitations and the need for quantization, the reconfigurable hardware achieved accuracy levels comparable to full-precision models, highlighting the potential of FINN for accelerating embedded neural networks. Therefore, the choice of the most suitable platform depends on the specific requirements of each application, balancing speed, energy consumption, and project complexity considerationsen
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectNeural networksen
dc.subjectRedes neuraispt_BR
dc.subjectProcessamento digital de imagenspt_BR
dc.subjectFPGAen
dc.subjectHardwarept_BR
dc.subjectFINNen
dc.subjectCPUen
dc.subjectGPUen
dc.subjectInferenceen
dc.subjectImage classificationen
dc.subjectQuantizationen
dc.subjectEnergy efficiencyen
dc.titleComparação de desempenho de redes neurais em diferentes plataformas de hardwarept_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb001240528pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentEscola de Engenhariapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2025pt_BR
dc.degree.graduationEngenharia Elétricapt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples