Show simple item record

dc.contributor.advisorVillavicencio, Alinept_BR
dc.contributor.authorFerreira, Eduardo Delazeript_BR
dc.date.accessioned2017-01-19T02:29:44Zpt_BR
dc.date.issued2016pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/150988pt_BR
dc.description.abstractOntologias linguísticas são recursos importantes na área de Processamento de Linguagem Natural, sendo a WordNet um exemplo de construção manual dessas ontologias. Infelizmente a criação e expansão dessas ontologias é difícil devido a necessidade de alta supervisão de especialistas. Para simplificar o processo de manutenção de ontologias foram criadas ontologias automáticas através de extração de padrões de texto. O método comumente usado para a criação automática de ontologias foi realizado em cima de corpus, buscando pares de palavras nestes textos para então descobrir padrões de ocorrência destas palavras. Esse é aplicável para aquisição de ontologia para qualquer domínio e quaisquer relações, dependendo apenas do domínio do corpus e das relações dos pares de entrada. Neste trabalho evidenciamos o comportamento de padrões em textos livres, avaliando um dos trabalho originários da área, os padrões de Hearst e o método criado nesse trabalho. Também avaliamos os padrões, os pares de palavras e seus comportamentos em textos livres. Os resultados apresentados demonstram que os padrões não se comportam, em textos livres, como esperado. Os resultados indicam que os padrões, mesmo os de Hearst, conhecidos por terem uma alta precisão, não apresentam uma unicidade de relações (são encontrados em mais de uma relação).pt_BR
dc.description.abstractLinguistic ontologies are important resources to the field of Natural Language Processing, WordNet is an example of such an ontology which was manually built. Unfortunately, the expansion of these ontologies is hard due to the need of a high level of specialized supervision. In order to simplify the process of maintenance of these ontologies, we developed an automatic process of building them through the extraction of text patterns. The proposed method for the automatic generation of ontologies was built using corpus, through the search of word pairs in texts in order to uncover patterns and their occurrences. Our method is suitable to the acquisition of ontologies for all domains and relations, and depends only upon the domain of the corpus and the input pair relationships. Our work shows how the above mentioned patterns happen for free texts, through an evaluation of both a previous work present in the literature - the Hearst patterns - and our own proposed method. Our work also evaluates the patterns, word pairs and their behavior in free texts. Our results show that resulting patterns do not behave in free texts as one would expect, in that even the Hearst patterns, known for their high level of precision, do not exhibit unicity of meaning.en
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectProcessamento : Linguagem naturalpt_BR
dc.subjectAutomatic ontology extractionen
dc.subjectPattern extractionen
dc.subjectNatural language processingen
dc.titleCriação de ontologias linguísticas automáticas a partir de textopt_BR
dc.title.alternativeAutomatic ontology creation from text en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coWilkens, Rodrigo Souzapt_BR
dc.identifier.nrb001009741pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2016pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Files in this item

Thumbnail
   

This item is licensed under a Creative Commons License

Show simple item record