Mostrar registro simples

dc.contributor.advisorFlores, João Henrique Ferreirapt_BR
dc.contributor.authorCunha, Vitor Hugo Fachinettopt_BR
dc.date.accessioned2025-05-03T06:55:34Zpt_BR
dc.date.issued2025pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/291107pt_BR
dc.description.abstractA predição musical, embora pouco explorada na literatura, oferece uma miríade de possibilidades de aplicações de metodologias estatísticas, especialmente métodos de aprendizado de máquina, dada a natureza criativa do processo de composição musical. Por se tratar de um tema incipiente, o desenvolvimento deste trabalho tem por objetivo propor e analisar a arquitetura de uma rede neural recorrente que interprete arquivos de áudio sob a perspectiva de séries temporais de frequências fundamentais, baseada em uma metodologia de modelos de classe Long Short-Term Memory. A avaliação do desempenho se deu pela utilização de medidas de erros quadráticos médios e de erros absolutos médios percentuais, bem como análises pontuais por gênero musical foram consideradas. Constatou-se que o modelo se ajusta melhor a músicas em que o gênero musical principal seja homogêneo em suas características, como ritmos e cadências, fornecendo dados de performance do modelo para comparações de uma maneira geral e segmentada por gênero. Além disso, discutiu-se sobre a influência de elementos intrínsecos do objeto de estudo sobre o treinamento do modelo e como diferentes configurações de taxas de amostragem de áudio e intervalos de frequência na estimação da frequência fundamental podem interferir no processo de aprendizagem de máquina.pt_BR
dc.description.abstractMusic prediction, although little explored in the literature, offers a myriad of possibilities for the application of statistical methodologies, especially machine learning methods, given the creative nature of the music composition process. Since this is an incipient topic, the development presented in this work aims to propose and analyze the architecture of a recurrent neural network that interprets audio files as time series of fundamental frequencies, based on a Long Short-Term Memory class model methodology. The performance evaluation was carried out using mean squared error measures and mean absolute percentage error, and specific analyses by musical genre are considered. It was found that the model fits better to songs in which the main musical genre is homogeneous in its characteristics, such as rhythms and cadences, providing model performance data for comparisons, in a general way and segmented by genre. Furthermore, the influence of intrinsic elements of the object of study on the training of the model was discussed, and how different configurations of audio sampling rates and frequency ranges in the estimation of the fundamental frequency can interfere in the machine learning process.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectMusicen
dc.subjectMúsicapt_BR
dc.subjectRedes neurais recorrentespt_BR
dc.subjectMusic predictionen
dc.subjectRecurrent neural networksen
dc.titlePredição de músicas utilizando redes neurais recorrentespt_BR
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb001255751pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Matemática e Estatísticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2025pt_BR
dc.degree.graduationEstatística: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples