Criação de ontologias linguísticas automáticas a partir de texto

Ferreira, Eduardo Delazeri

dc.contributor.advisor	Villavicencio, Aline	pt_BR
dc.contributor.author	Ferreira, Eduardo Delazeri	pt_BR
dc.date.accessioned	2017-01-19T02:29:44Z	pt_BR
dc.date.issued	2016	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/150988	pt_BR
dc.description.abstract	Ontologias linguísticas são recursos importantes na área de Processamento de Linguagem Natural, sendo a WordNet um exemplo de construção manual dessas ontologias. Infelizmente a criação e expansão dessas ontologias é difícil devido a necessidade de alta supervisão de especialistas. Para simplificar o processo de manutenção de ontologias foram criadas ontologias automáticas através de extração de padrões de texto. O método comumente usado para a criação automática de ontologias foi realizado em cima de corpus, buscando pares de palavras nestes textos para então descobrir padrões de ocorrência destas palavras. Esse é aplicável para aquisição de ontologia para qualquer domínio e quaisquer relações, dependendo apenas do domínio do corpus e das relações dos pares de entrada. Neste trabalho evidenciamos o comportamento de padrões em textos livres, avaliando um dos trabalho originários da área, os padrões de Hearst e o método criado nesse trabalho. Também avaliamos os padrões, os pares de palavras e seus comportamentos em textos livres. Os resultados apresentados demonstram que os padrões não se comportam, em textos livres, como esperado. Os resultados indicam que os padrões, mesmo os de Hearst, conhecidos por terem uma alta precisão, não apresentam uma unicidade de relações (são encontrados em mais de uma relação).	pt_BR
dc.description.abstract	Linguistic ontologies are important resources to the field of Natural Language Processing, WordNet is an example of such an ontology which was manually built. Unfortunately, the expansion of these ontologies is hard due to the need of a high level of specialized supervision. In order to simplify the process of maintenance of these ontologies, we developed an automatic process of building them through the extraction of text patterns. The proposed method for the automatic generation of ontologies was built using corpus, through the search of word pairs in texts in order to uncover patterns and their occurrences. Our method is suitable to the acquisition of ontologies for all domains and relations, and depends only upon the domain of the corpus and the input pair relationships. Our work shows how the above mentioned patterns happen for free texts, through an evaluation of both a previous work present in the literature - the Hearst patterns - and our own proposed method. Our work also evaluates the patterns, word pairs and their behavior in free texts. Our results show that resulting patterns do not behave in free texts as one would expect, in that even the Hearst patterns, known for their high level of precision, do not exhibit unicity of meaning.	en
dc.format.mimetype	application/pdf
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Processamento : Linguagem natural	pt_BR
dc.subject	Automatic ontology extraction	en
dc.subject	Pattern extraction	en
dc.subject	Natural language processing	en
dc.title	Criação de ontologias linguísticas automáticas a partir de texto	pt_BR
dc.title.alternative	Automatic ontology creation from text	en
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.contributor.advisor-co	Wilkens, Rodrigo Souza	pt_BR
dc.identifier.nrb	001009741	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2016	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 001009741.pdf
Tamanho:: 433.8Kb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (37361)

TCC Ciência da Computação (1024)

Mostrar registro simples