Unsupervised learning strategies for automatic generation of personalized summaries
Visualizar/abrir
Data
2019Autor
Orientador
Nível acadêmico
Doutorado
Tipo
Outro título
Métodos não-supervisionados para a geração automática de sumários personalizados
Assunto
Abstract
It is relatively hard for readers to deal objectively with large documents in order to absorb the key idea about a particular subject. In this sense, automatic text summarization plays an important role by systematically digest a large number of documents to produce indepth abstracts. Despite fifty years of studies in automatic summarization of texts, one of the still persistent shortcomings is that the individual interests of the readers are still not considered. Regarding the automatic techni ...
It is relatively hard for readers to deal objectively with large documents in order to absorb the key idea about a particular subject. In this sense, automatic text summarization plays an important role by systematically digest a large number of documents to produce indepth abstracts. Despite fifty years of studies in automatic summarization of texts, one of the still persistent shortcomings is that the individual interests of the readers are still not considered. Regarding the automatic techniques for generation of summaries, it mostly relies on supervised Machine Learning algorithms such as classification and regression, however, the quality of results is dependent on the existence of a large, domain-dependent training data set. On the other hand, unsupervised learning strategies are an attractive alternative to avoid the labor-intense and error-prone task of manual annotation of training data sets. To accomplish such objective, this work puts forward a novel unsupervised and semi-supervised algorithms to automatically generate tailored summaries. Our experiments showed that we can effectively identify a significant number of interesting passages for the readers with less data for the training step. ...
Resumo
É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o process ...
É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.
Coleções
-
Ciências Exatas e da Terra (5129)Computação (1764)
Este item está licenciado na Creative Commons License