Extração de tópicos em Notas Fiscais Eletrônicas (NF-e) : uma análise utilizando BERTopic
dc.contributor.advisor | Barbian, Márcia Helena | pt_BR |
dc.contributor.author | Boll, Antônio Oss | pt_BR |
dc.date.accessioned | 2024-08-06T06:35:40Z | pt_BR |
dc.date.issued | 2024 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/276955 | pt_BR |
dc.description.abstract | À medida que informações são geradas, a busca por suas interpretações cresce. No entanto, em muitos bancos de dados, a falta de rotulação dificulta sua interpretabilidade. Assim, os modelos de aprendizado profundo surgem para abordar essas tarefas complexas de Processamento de Linguagem Natural. Utilizando dados não rotulados obtidos de Notas Fiscais Eletrônicas da Secretaria da Fazenda do Rio Grande do Sul, este trabalho visa construir um modelo BERTopic para agrupar produtos semelhantes em tópicos. Durante essa modelagem, diversos hiperparâmetros foram variados, com o objetivo de encontrar o melhor resultado com base em métricas como a silhueta e considerando também o número de tópicos gerados. | pt_BR |
dc.description.abstract | As information is generated, the search for its interpretations grows. However, in many databases, the lack of labeling complicates their interpretability. Thus, deep learning models emerge to address these complex tasks in Natural Language Processing. Using unlabeled data obtained from Electronic Invoices of the Department of Finance of Rio Grande do Sul, this work aims to build a BERTopic model to group similar products into topics. During this modeling process, various hyperparameters were adjusted, aiming to find the best result based on metrics such as silhouette and also considering the number of generated topics. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Aprendizado profundo | pt_BR |
dc.subject | BERTopic | en |
dc.subject | BERT | en |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Deep learning | en |
dc.subject | Natural language processing | en |
dc.subject | Non labeled data | en |
dc.subject | Topic modeling | en |
dc.title | Extração de tópicos em Notas Fiscais Eletrônicas (NF-e) : uma análise utilizando BERTopic | pt_BR |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 001207967 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Matemática e Estatística | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2024 | pt_BR |
dc.degree.graduation | Estatística: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Files in this item
This item is licensed under a Creative Commons License