Mostrar el registro sencillo del ítem
Comparação de desempenho de redes neurais em diferentes plataformas de hardware
dc.contributor.advisor | Azambuja, José Rodrigo Furlanetto de | pt_BR |
dc.contributor.author | Pietta, Enzo Victor Zucchetti | pt_BR |
dc.date.accessioned | 2025-01-31T06:55:40Z | pt_BR |
dc.date.issued | 2025 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/284236 | pt_BR |
dc.description.abstract | Este trabalho investigou o desempenho de Redes Neurais Convolucionais (CNN) aplicadas à classificação de imagens em três plataformas de hardware distintas: CPU, GPU e FPGA. Para isso, foram utilizados três conjuntos de dados (MNIST, CIFAR-10 e SAT 6), cada um associado a uma rede neural específica. Inicialmente, implementaram-se modelos em precisão total, executados na CPU e GPU, e, em paralelo, desenvolveu se uma versão quantizada dessas redes para implementação em FPGA por meio do framework FINN. As principais métricas de avaliação contemplaram acurácia, latência, vazão e dissipação de potência, possibilitando uma análise abrangente de desempenho. Os resultados indicaram que a GPU se sobressai em termos de vazão, sobretudo em cenários com lotes grandes, graças ao processamento maciço e paralelo. No entanto, apresenta dissipação de potência mais elevada e sofre com latências maiores para lotes unitários, em função dos custos de transferência de dados. Já a CPU obteve latências baixas para inferências individuais, mantendo um consumo energético intermediário e um desempenho adequado para aplicações que não exigem alta taxa de processamento simultâneo. A implementação em FPGA, por sua vez, demonstrou vantagens em cenários que priorizam eficiência energética e latências mais previsíveis, especialmente em lotes pequenos. Mesmo com as limitações de recursos e a necessidade de quantização, o hardware reconfigurável alcançou acurácias semelhantes aos modelos em precisão total, evidenciando o potencial do FINN para acelerar redes neurais embarcadas. Assim, a escolha da plataforma mais apropriada depende dos requisitos específicos de cada aplicação, balanceando aspectos de velocidade, consumo de energia e complexidade do projeto | pt_BR |
dc.description.abstract | This work investigated the performance of Convolutional Neural Networks (CNNs) applied to image classification on three distinct hardware platforms: CPU, GPU, and FPGA. To achieve this, three datasets (MNIST, CIFAR-10, and SAT-6) were used, each associated with a specific neural network. Initially, full-precision models were implemented and executed on the CPU and GPU. Simultaneously, a quantized version of these networks was developed for FPGA implementation using the FINN framework. The main evaluation metrics included accuracy, latency, throughput, and power dissipation, enabling a comprehensive performance analysis. The results indicated that the GPU excelled in terms of throughput, particularly in scenarios with large batch sizes, due to its massive parallel processing capabilities. However, it exhibited higher power dissipation and faced increased latency for single-batch inferences due to data transfer overhead. The CPU, on the other hand, achieved low latencies for individual inferences, maintained intermediate energy consumption, and delivered adequate performance for applications not requiring high simultaneous processing rates. The FPGA implementation demonstrated advantages in scenarios prioritizing energy efficiency and more predictable latencies, especially with small batch sizes. Despite resource limitations and the need for quantization, the reconfigurable hardware achieved accuracy levels comparable to full-precision models, highlighting the potential of FINN for accelerating embedded neural networks. Therefore, the choice of the most suitable platform depends on the specific requirements of each application, balancing speed, energy consumption, and project complexity considerations | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Neural networks | en |
dc.subject | Redes neurais | pt_BR |
dc.subject | Processamento digital de imagens | pt_BR |
dc.subject | FPGA | en |
dc.subject | Hardware | pt_BR |
dc.subject | FINN | en |
dc.subject | CPU | en |
dc.subject | GPU | en |
dc.subject | Inference | en |
dc.subject | Image classification | en |
dc.subject | Quantization | en |
dc.subject | Energy efficiency | en |
dc.title | Comparação de desempenho de redes neurais em diferentes plataformas de hardware | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 001240528 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Escola de Engenharia | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2025 | pt_BR |
dc.degree.graduation | Engenharia Elétrica | pt_BR |
dc.degree.level | graduação | pt_BR |
Ficheros en el ítem
Este ítem está licenciado en la Creative Commons License

-
Tesinas de Curso de Grado (38551)Tesinas Ingenierías (5990)