Criação de ontologias linguísticas automáticas a partir de texto
dc.contributor.advisor | Villavicencio, Aline | pt_BR |
dc.contributor.author | Ferreira, Eduardo Delazeri | pt_BR |
dc.date.accessioned | 2017-01-19T02:29:44Z | pt_BR |
dc.date.issued | 2016 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/150988 | pt_BR |
dc.description.abstract | Ontologias linguísticas são recursos importantes na área de Processamento de Linguagem Natural, sendo a WordNet um exemplo de construção manual dessas ontologias. Infelizmente a criação e expansão dessas ontologias é difícil devido a necessidade de alta supervisão de especialistas. Para simplificar o processo de manutenção de ontologias foram criadas ontologias automáticas através de extração de padrões de texto. O método comumente usado para a criação automática de ontologias foi realizado em cima de corpus, buscando pares de palavras nestes textos para então descobrir padrões de ocorrência destas palavras. Esse é aplicável para aquisição de ontologia para qualquer domínio e quaisquer relações, dependendo apenas do domínio do corpus e das relações dos pares de entrada. Neste trabalho evidenciamos o comportamento de padrões em textos livres, avaliando um dos trabalho originários da área, os padrões de Hearst e o método criado nesse trabalho. Também avaliamos os padrões, os pares de palavras e seus comportamentos em textos livres. Os resultados apresentados demonstram que os padrões não se comportam, em textos livres, como esperado. Os resultados indicam que os padrões, mesmo os de Hearst, conhecidos por terem uma alta precisão, não apresentam uma unicidade de relações (são encontrados em mais de uma relação). | pt_BR |
dc.description.abstract | Linguistic ontologies are important resources to the field of Natural Language Processing, WordNet is an example of such an ontology which was manually built. Unfortunately, the expansion of these ontologies is hard due to the need of a high level of specialized supervision. In order to simplify the process of maintenance of these ontologies, we developed an automatic process of building them through the extraction of text patterns. The proposed method for the automatic generation of ontologies was built using corpus, through the search of word pairs in texts in order to uncover patterns and their occurrences. Our method is suitable to the acquisition of ontologies for all domains and relations, and depends only upon the domain of the corpus and the input pair relationships. Our work shows how the above mentioned patterns happen for free texts, through an evaluation of both a previous work present in the literature - the Hearst patterns - and our own proposed method. Our work also evaluates the patterns, word pairs and their behavior in free texts. Our results show that resulting patterns do not behave in free texts as one would expect, in that even the Hearst patterns, known for their high level of precision, do not exhibit unicity of meaning. | en |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Processamento : Linguagem natural | pt_BR |
dc.subject | Automatic ontology extraction | en |
dc.subject | Pattern extraction | en |
dc.subject | Natural language processing | en |
dc.title | Criação de ontologias linguísticas automáticas a partir de texto | pt_BR |
dc.title.alternative | Automatic ontology creation from text | en |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisor-co | Wilkens, Rodrigo Souza | pt_BR |
dc.identifier.nrb | 001009741 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2016 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License
-
TCC Ciência da Computação (1024)