Agrupamento de sentenças semanticamente similares aplicado à descoberta de novas intenções para chatbots cognitivos
View/ Open
Date
2022Author
Advisor
Academic level
Graduation
Subject
Abstract in Portuguese (Brasil)
O trabalho apresenta uma solução de automação para o processo de descoberta de novas intenções para chatbots cognitivos. Para tanto, representações vetoriais das mensagens enviadas por usuários a um chatbot cognitivo são obtidas por meio de um modelo de linguagem neural para a língua portuguesa brasileira baseado no BERT, o BERTimbau. Na sequência, a fim de identificar os assuntos requisitados pelos usuários e viabilizar a construção de intenções, mensagens semelhantes são agrupadas por meio da ...
O trabalho apresenta uma solução de automação para o processo de descoberta de novas intenções para chatbots cognitivos. Para tanto, representações vetoriais das mensagens enviadas por usuários a um chatbot cognitivo são obtidas por meio de um modelo de linguagem neural para a língua portuguesa brasileira baseado no BERT, o BERTimbau. Na sequência, a fim de identificar os assuntos requisitados pelos usuários e viabilizar a construção de intenções, mensagens semelhantes são agrupadas por meio da execução de um algoritmo não supervisionado de agrupamento hierárquico aglomerativo sobre as suas representações vetoriais. Para que os agrupamentos obtidos possam ser investigados de uma maneira acessível, foi desenvolvida uma ferramenta de visualização na forma de uma aplicação web. Em um estudo de caso, a aplicação da solução proposta foi capaz de agrupar sentenças com sentido semelhante mesmo quando construídas com palavras distintas, possibilitando, com sucesso, a identificação de intenções a serem inseridas ao chatbot cognitivo a partir de mensagens enviadas pelos seus usuários. ...
Abstract
The work presents an automation solution for the process of discovering new intents for cognitive chatbots. To do so, sentence embeddings of messages sent by users to a cognitive chatbot are obtained by means of a neural language model for Brazilian Portuguese based on BERT, which is known as BERTimbau. Subsequently, in order to identify the subjects requested by users and enable the creation of intents, similar messages are grouped together by the execution of an unsupervised agglomerative hie ...
The work presents an automation solution for the process of discovering new intents for cognitive chatbots. To do so, sentence embeddings of messages sent by users to a cognitive chatbot are obtained by means of a neural language model for Brazilian Portuguese based on BERT, which is known as BERTimbau. Subsequently, in order to identify the subjects requested by users and enable the creation of intents, similar messages are grouped together by the execution of an unsupervised agglomerative hierarchical clustering algorithm over their vector representations. So that the clusters obtained can be investigated in an accessible way, a visualization tool was developed as a web application. In a case study, the application of the proposed solution was able to group sentences with similar meaning even when made up of different words, successfully enabling the identification of intents to be added to the cognitive chatbot from messages sent by its users. ...
Institution
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Curso de Engenharia de Controle e Automação.
Collections
This item is licensed under a Creative Commons License