Mostrar el registro sencillo del ítem

dc.contributor.advisorVillavicencio, Alinept_BR
dc.contributor.authorGonçalves, Gabriel Costapt_BR
dc.date.accessioned2016-01-20T02:40:03Zpt_BR
dc.date.issued2015pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/132028pt_BR
dc.description.abstractNo estudo do processamento de linguagem natural, os tesauros distribucionais, que representam modelos semânticos de linguagens, são muito utilizados em tarefas que envolvem relações semânticas, tais como respostas a perguntas, simplificação de texto, desambiguação, análise de sentimentos, entre outras. Uma barreira frequentemente encontrada nestas tarefas é a falta destes recursos - seja devido a altos custos de criá-los e extendê-los, difícil acesso ou até mesmo por serem inexistentes para algumas línguas. Muitos esforços são dedicados à construção automática de tesauros, e diferentes técnicas foram desenvolvidas a fim de atingir este objetivo, mas elas precisam ser cuidadosamente avaliadas para garantir que a qualidade dos resultados obtidos seja satisfatória. Este trabalho fará uma comparação entre modelos semânticos distribucionais construídos automaticamente para dois idiomas, português e inglês, para determinar se estas técnicas podem ser aplicadas em linguagens com diferentes características léxicas e sintáticas. Também serão comparadas duas técnicas de construção de tesauros para determinar se elas são equivalentes. Finalmente, será examinado o impacto do tamanho e do tipo de contexto utilizado para cada modelo, assumindo que contextos maiores levam a resultados de maior qualidade. Modelos semânticos construídos automaticamente implicam em uma redução de custos e aumento na abrangência e acessibilidade da área de processamento de linguagem ao permitir a criação destes recursos para idiomas que não possuam tesauros construídos manualmente ou para os quais estes recursos sejam de difícil acesso.pt_BR
dc.description.abstractIn Natural Language Processing, distributional thesauri, semantic model language representations, are widely used in tasks that involve semantic relations, such as question answering, text simplification, disambiguation and sentiment analysis. A frequent barrier to these tasks is the lack of resources - either due to the high cost of manually constructing and extending them, difficulty of access or even because they do not exist for some languages. Therefore much effort have been dedicated to the automatic construction of thesauri, and different techniques have been developed in order to reach that goal, but they need to be carefully assessed to ensure the quality of the results obtained with them is satisfactory. This work compares distributional semantic models built automatically for two different languages, Portuguese and English, to determine whether the techniques can be robustly applied to languages with different lexical and syntactics characteristics. Secondly, we compare two different techniques for thesaurus construction, to determine if they are equivalent. Finally we examine the impact of the type and size of context used for each of the model, assuming that larger contexts lead to better quality results. Automatically built semantic models imply in a cost reduction and a raise in coverage and accessibility of the area by enabling the construction of these resources for languages that may not have manually built ones or for languages whose resources have restrict access.en
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectNatural language processingen
dc.subjectProcessamento : Linguagem naturalpt_BR
dc.subjectLinguística computacionalpt_BR
dc.subjectCorpusen
dc.subjectThesaurusen
dc.subjectThesaurus constructionen
dc.subjectAutomatically built resourcesen
dc.titleConstrução e avaliação de modelos semânticos distribucionaispt_BR
dc.title.alternativeConstruction and evaluation of semantic distributional models en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb000972929pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2015pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Ficheros en el ítem

Thumbnail
   

Este ítem está licenciado en la Creative Commons License

Mostrar el registro sencillo del ítem