Automatic compositionality detection from corpora
dc.contributor.advisor | Villavicencio, Aline | pt_BR |
dc.contributor.author | Gamboa, John Cristian Borges | pt_BR |
dc.date.accessioned | 2014-01-22T01:54:34Z | pt_BR |
dc.date.issued | 2013 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/86409 | pt_BR |
dc.description.abstract | Phrasal verbs in English present varying levels of semantic idiosyncrasies. Aiming to detect some of these idiosyncrasies (in this case, how much of the meaning of a phrasal verb can be extracted from each of its words) a set of measures was proposed by MCC (2003), which use a thesaurus as input. This work reimplements those measures, focusing on checking how robust they are, by applying them on several thesauri. The thesauri were built using the method in Lin (1998). We evaluate our results using a gold standard, and the results suggest the PMI as the best way to filter the contexts the verbs are found in. | en |
dc.description.abstract | A classe de verbos frasais da língua inglesa apresenta níveis variáveis de idiosincrasias semânticas. Com o objetivo de detectar algumas dessas idiossincrasias (nesse caso, quanto do significado de um verbo frasal pode ser extraído de cada uma de suas palavras) um conjunto de medidades foi proposto por MCC (2003), o qual usa um tessauro como entrada. Este trabalho reimplementa essas medidas, com o foco de verificar o quão robustas elas são, ao aplicá-las em diferentes tessauros. Os tessauros são construídos usando o método em Lin (1998). Nós avaliamos nossos resultados usando uma gold standard, e os resultados sugerem o PMI como a melhor forma de filtrar os contextos nos quais os verbos são encontrados. | pt_BR |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | eng | pt_BR |
dc.rights | Open Access | en |
dc.subject | Processamento : Linguagem natural | pt_BR |
dc.subject | Multiword expressions | en |
dc.subject | Gerencia : Projeto | pt_BR |
dc.subject | Natural language processing | en |
dc.subject | Verb-particle constructions | en |
dc.subject | Compositionality detection | en |
dc.title | Automatic compositionality detection from corpora | pt_BR |
dc.title.alternative | Detecção automática de composicionalidade a partir de corpora | pt |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisor-co | Padró, Muntsa | pt_BR |
dc.identifier.nrb | 000910102 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2013 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Files in this item
This item is licensed under a Creative Commons License