Classificação de sons ambientais utilizando redes neurais convolucionais para aplicações em hardwares com recursos limitados
Visualizar/abrir
Data
2023Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
A classificação de sons ambientais tem encontrado aplicabilidade em diversos setores, como sistemas de vigilância de áudio, monitoramento inteligente, preservação ambiental e detecção de ruído em áreas urbanas. No contexto de cidades inteligentes, que buscam soluções tecnológicas para os desafios da urbanização, a classificação de sons se mostra especialmente relevante. Com a integração de técnicas de aprendizado de máquina, torna-se possível aprimorar o desempenho no reconhecimento de padrões ...
A classificação de sons ambientais tem encontrado aplicabilidade em diversos setores, como sistemas de vigilância de áudio, monitoramento inteligente, preservação ambiental e detecção de ruído em áreas urbanas. No contexto de cidades inteligentes, que buscam soluções tecnológicas para os desafios da urbanização, a classificação de sons se mostra especialmente relevante. Com a integração de técnicas de aprendizado de máquina, torna-se possível aprimorar o desempenho no reconhecimento de padrões acústicos, facilitando a implementação de soluções mais robustas e adaptativas em aplicações práticas. A presente pesquisa analisa 5 topologias de redes neurais convolucionais propostas em trabalhos relacionados (SBCNN, DMIX, STRIDED, 2DCNN e 1DCNN) a partir de três técnicas de extração de características (espectrograma em escala logarítmica, espectrograma mel e espectrograma mel em escala logarítmica) e com e sem a utilização de Data Augmentation. Os modelos foram validados a partir da utilização de técnica 10-fold cross validation. A partir dos resultados obtidos, foram aplicadas as técnicas de poda computacional e quantização para redução do número de parâmetros e tamanho dos modelos. A topologia STRIDED obteve taxa de acerto média de 72, 19%, com 149.892 parâmetros (80% de esparsidade) e tamanho médio de 217.498 bytes para a base de dados UrbanSound8K, enquanto que a topologia SBCNN obteve taxa de acerto de 73, 48%, com 86.476 parâmetros e tamanho médio de 125.669 bytes. ...
Abstract
Environmental sound classification has found applicability in several fields such as audio surveillance systems, smart monitoring, environmental conservation, and noise detection in urban areas. Sound classification is essential within the context of smart cities, which seek technological solutions to the challenges of urbanization. With the integration of machine learning techniques, enhancing performance in acoustic pattern recognition becomes possible, facilitating the implementation of more ...
Environmental sound classification has found applicability in several fields such as audio surveillance systems, smart monitoring, environmental conservation, and noise detection in urban areas. Sound classification is essential within the context of smart cities, which seek technological solutions to the challenges of urbanization. With the integration of machine learning techniques, enhancing performance in acoustic pattern recognition becomes possible, facilitating the implementation of more robust and adaptive solutions in practical applications. The current research examines 5 topologies of convolutional neural networks proposed in related works (SBCNN, DMIX, STRIDED, 2DCNN and 1DCNN) using three feature extraction techniques (log-scaled spectrogram, mel spectrogram, and log-scaled mel spectrogram), both with and without the use of Data Augmentation. The models were validated using the 10-fold cross validation technique. Based on the results, pruning and quantization techniques were applied to reduce the number of parameters and model sizes. The STRIDED topology achieved an average accuracy rate of 72.19%, with 149, 892 parameters (80% sparsity) and an average size of 217, 498 bytes for the UrbanSound8K database. Meanwhile, the SBCNN topology achieved an accuracy rate of 73.48%, with 86, 476 parameters and an average size of 125, 669 bytes. ...
Instituição
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Curso de Engenharia Elétrica.
Coleções
-
TCC Engenharias (5855)
Este item está licenciado na Creative Commons License