Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações
dc.contributor.advisor | Moreira, Viviane Pereira | pt_BR |
dc.contributor.author | Flores, Felipe Nunes | pt_BR |
dc.date.accessioned | 2010-02-19T04:14:43Z | pt_BR |
dc.date.issued | 2009 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/18532 | pt_BR |
dc.description.abstract | A qualidade de um algoritmo de stemming é tipicamente medida de duas formas: (i) quão corretamente o algoritmo mapeia as diferentes formas de uma palavra para o mesmo stem; ou (ii) qual o nível de melhora que o algoritmo proporciona à Recuperação de Informações. O presente trabalho apresenta o desenvolvimento de uma ferramenta que implementa o método de Paice, o qual serve para avaliar os algoritmos de stemming de acordo com a primeira métrica mencionada acima. Além disso, diversos algoritmos de stemming para a língua portuguesa são avaliados de acordo com as duas métricas, a fim de verificar se os stemmers de maior qualidade são também aqueles que trazem o maior ganho para a Recuperação de Informações. Os resultados mostram que essa relação existe, porém ela não é tão forte quanto se poderia esperar. | pt_BR |
dc.description.abstract | The quality of a stemming algorithm is typically measured in two ways: (i) how accurately the algorithm maps the different forms of a word to the same stem; or (ii) the level of improvement that the algorithm provides to Information Retrieval. This paper presents a tool that implements Paice’s method, whose purpose is to evaluate stemming algorithms according to the first metric mentioned above. Besides, different Portuguese stemming algorithms are evaluated according to both metrics, in order to assess whether the most accurate stemmers are also the ones that bring the most gain to Information Retrieval. The results show that this relation does exist, but it is not as strong as one might have expected. | en |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Stemming | en |
dc.subject | Stemmer | pt_BR |
dc.subject | Paice’s method | en |
dc.subject | Recuperacao : Informacao | pt_BR |
dc.subject | Information retrieval | en |
dc.subject | Evaluation | en |
dc.title | Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações | pt_BR |
dc.title.alternative | Assessing the impact of a stemming algorithm’s accuracy on information retrieval | en |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.contributor.advisor-co | Heuser, Carlos Alberto | pt_BR |
dc.identifier.nrb | 000730582 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2009 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Este item está licenciado na Creative Commons License