Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas

Saul, Gabriel Holmer

dc.contributor.advisor	Barbian, Márcia Helena	pt_BR
dc.contributor.author	Saul, Gabriel Holmer	pt_BR
dc.date.accessioned	2023-11-28T03:23:37Z	pt_BR
dc.date.issued	2023	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/267734	pt_BR
dc.description.abstract	O aumento contínuo da geração e armazenamento de dados de texto, somado ao expressivo aumento do poder computacional, trouxe a necessidade de se ajustar modelos estatísticos mais complexos, provocando uma demanda substancial por métodos da área de Processamento de Linguagem Natural (NLP). As técnicas de NLP podem ser aplicadas em um vasto número de tarefas, como tradução de máquina, análise de sentimento e classificação de texto. Dentre estas tarefas, destaca-se a detecção automatizada de notícias falsas, também chamadas de fake news, que são cada vez mais presentes na sociedade com o advento de programas de computadores capazes de gerar e disseminar notícias falsas entre diversos meios de comunicação. Para combater a propagação de fake news, é possível utilizar o modelo de NLP BERT, que é capaz de representar o significado semântico e sintático de uma palavra a partir do seu contexto. Neste trabalho, é feita uma aplicação do modelo BERT para determinar se uma notícia específica de língua inglesa é falsa ou não, analisando a descrição textual de seu título. O banco de dados utilizado contém 72.134 notícias, já categorizadas entre verdadeiras e falsas, que foram extraídas de diferentes portais. Os resultados apontam para um bom desempenho do modelo ajustado, o que pode contribuir no combate à desinformação e auxiliar estudos futuros na área.	pt_BR
dc.description.abstract	The continuous increase in the generation and storage of text data, added to the significant increase in computational power, brought the need to fit more complex statistical models, causing a substantial demand for methods in the field of Natural Language Processing (NLP). NLP techniques can be applied to a vast number of tasks, such as machine translation, sentiment analysis and text classification. Among these tasks, the automated detection of fake news stands out, which are increasingly present in society with the advent of computer programs capable of generating and disseminating fake news among various means of communication. To combat the spread of fake news, it is possible to use the BERT NLP model, which is capable of representing the semantic and syntactic meaning of a word from its context. In this work, an application of the BERT model is made to determine whether a certain news article in English is fake or not, analyzing the textual description of its title. The dataset used contains 72,134 news, already categorized between true and false, which were extracted from different portals. The results point to a good performance of the adjusted model, which can contribute to the fight against misinformation and help future studies in the area.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Natural language processing	en
dc.subject	Processamento de linguagem natural	pt_BR
dc.subject	Deep learning	en
dc.subject	Notícia falsa	pt_BR
dc.subject	Word embeddings	en
dc.subject	Transformers	en
dc.subject	Fake news	en
dc.title	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas	pt_BR
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.identifier.nrb	001188417	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Matemática e Estatística	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2023	pt_BR
dc.degree.graduation	Estatística: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 001188417.pdf
Tamanho:: 1.869Mb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (40911)

TCC Estatística (312)

Mostrar registro simples