Análise e síntese de um acelerador de hardware de redes neurais para um Core RISC-V
View/ Open
Date
2025Author
Advisor
Co-advisor
Academic level
Graduation
Title alternative
Analysis and synthesis of a hardware accelerator from neural networks to a RISC-V Core
Subject
Abstract in Portuguese (Brasil)
As redes neurais têm se destacado como uma das principais tecnologias impulsionadoras da Inteligência Artificial (IA) moderna, sendo amplamente aplicadas em diversas áreas, como visão computacional, processamento de linguagem natural e sistemas autônomos. Contudo, o crescimento exponencial dessas aplicações traz desafios relacionados ao consumo de energia, custo e eficiência, especialmente em dispositivos voltados para o uso final, como smartphones e dispositivos embarcados. Embora as GPUs seja ...
As redes neurais têm se destacado como uma das principais tecnologias impulsionadoras da Inteligência Artificial (IA) moderna, sendo amplamente aplicadas em diversas áreas, como visão computacional, processamento de linguagem natural e sistemas autônomos. Contudo, o crescimento exponencial dessas aplicações traz desafios relacionados ao consumo de energia, custo e eficiência, especialmente em dispositivos voltados para o uso final, como smartphones e dispositivos embarcados. Embora as GPUs sejam amplamente utilizadas para treinamento e inferência de redes neurais devido à sua alta capacidade de paralelismo, elas apresentam limitações significativas no contexto de dispositivos embarcados, como alto consumo energético e custo elevado. Nesse cenário, este trabalho propõe a implementação de aceleradores de hardware dedicados integrados a processadores RISC-V como uma solução viável para sistemas embarcados de IA. Para isso, foi treinada uma rede neural convolucional classificadora de imagens utilizando PyTorch. A rede foi convertida para o formato ONNX e processada na ferramenta NNgen, que gerou uma descrição em Verilog para implementação em hardware. Em seguida, o módulo gerado foi integrado ao processador RISC-V Steel por meio de um tradutor de protocolo AXI, permitindo sua comunicação com o barramento. Por fim, foi realizada a síntese lógica do sistema integrado, avaliando sua viabilidade como solução embarcada. Os resultados demonstraram que a abordagem proposta oferece uma solução eficiente, combinando a modularidade e flexibilidade do processador RISC-V com a eficiência energética de aceleradores de hardware personalizados. Além disso, a integração com o Steel Core mostrou-se uma alternativa promissora para aplicações finais de IA embarcada, destacando o potencial dessa combinação no desenvolvimento de sistemas eficientes e otimizados para dispositivos de baixo custo e consumo energético. ...
Abstract
Neural networks have emerged as one of the leading technologies driving modern Artificial Intelligence (AI), being widely applied in various fields such as computer vision, natural language processing, and autonomous systems. However, the exponential growth of these applications brings challenges related to energy consumption, cost, and efficiency, especially in end-use devices like smartphones and embedded systems. Although GPUs are widely used for training and inference of neural networks due ...
Neural networks have emerged as one of the leading technologies driving modern Artificial Intelligence (AI), being widely applied in various fields such as computer vision, natural language processing, and autonomous systems. However, the exponential growth of these applications brings challenges related to energy consumption, cost, and efficiency, especially in end-use devices like smartphones and embedded systems. Although GPUs are widely used for training and inference of neural networks due to their high parallelism capacity, they present significant limitations in embedded contexts, such as high energy consumption and elevated costs. In this context, this work proposes the implementation of dedicated hardware accelerators integrated with RISC-V processors as a viable solution for embedded AI systems. To this end, an image classification convolutional neural network was trained using PyTorch. The network was converted to the ONNX format and processed with the NNgen tool, which generated a Verilog description for hardware implementation. Subsequently, the generated module was integrated into the RISC-V Steel processor via an AXI protocol translator, enabling communication with the bus. Finally, the logical synthesis of the integrated system was performed, assessing its feasibility as an embedded solution. The results demonstrated that the proposed approach offers an efficient solution by combining the modularity and flexibility of the RISC-V processor with the energy efficiency of custom hardware accelerators. Furthermore, the integration with the Steel Core proved to be a promising alternative for embedded AI applications, highlighting the potential of this combination in developing efficient and optimized systems for low-cost and low-power devices. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Engenharia da Computação: Bacharelado.
Collections
This item is licensed under a Creative Commons License
