Detecção de emoções utilizando redes neurais convolucionais em sistemas com recursos limitados de hardware
dc.contributor.advisor | Weber, Tiago Oliveira | pt_BR |
dc.contributor.author | Garcia, Lucas Henz | pt_BR |
dc.date.accessioned | 2022-01-19T04:36:24Z | pt_BR |
dc.date.issued | 2021 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/234173 | pt_BR |
dc.description.abstract | O uso de redes neurais convolucionais na detecção de emoções através da expressão facial (FER, do inglês Facial Emotion Recognizer) em sistemas com recursos limitados de hardware é uma opção viável por aliar assertividade e sistemas finais com baixa complexidade de uso. A presente pesquisa detalha a análise estatística de seis topologias de código aberto com métricas de assertividade e de número de parâmetros utilizados, com e sem estratégia de Data Augmentation, e descreve o projeto de implementação de um detector de emoções baseado na arquitetura com melhor desempenho em um Raspberry Pi com câmera. Em adição, a rede foi simplificada e comprimida, através de poda computacional, utilizando esparsidade constante, e de quantização com alcance dinâmico. A estrutura apresentou como resultado uma assertividade média de 68,5% para a base de dados FER-2013, utilizando 398.000 parâmetros (70% de esparsidade), com latência média de 168 ms e tamanho médio de 663.255 bytes, sendo capaz de classificar todas as emoções do espectro de Ekman em tempo real. | pt_BR |
dc.description.abstract | The use of convolutional neural networks to detect emotions through facial expression (FER) in systems with limited resources is a viable option for combining assertiveness and final systems with low complexity of use. This research details the statistical analysis of six open source topologies with metrics of assertiveness and number of parameters used, with and without Data Augmentation strategy, and describes the implementation project of an emotion detector based on the architecture with the best performance in a Raspberry Pi with camera. In addition, the network was simplified and compressed, through pruning, using constant sparsity, and quantization with dynamic range. The structure presented as a result an average assertiveness of 68.5% for the FER-2013 database, using 398,000 parameters (70% sparsity), with an average latency of 168 ms and an average size of 663,255 bytes, being able to classify all emotions in real-time of the Ekman spectrum. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Convolutional networks | en |
dc.subject | Reconhecimento facial | pt_BR |
dc.subject | Emoções | pt_BR |
dc.subject | Pruning | en |
dc.subject | Quantization | en |
dc.subject | Redes neurais | pt_BR |
dc.subject | Raspberry Pi | en |
dc.title | Detecção de emoções utilizando redes neurais convolucionais em sistemas com recursos limitados de hardware | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 001134980 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Escola de Engenharia | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2021 | pt_BR |
dc.degree.graduation | Engenharia Elétrica | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License
-
TCC Engenharias (5856)