Termos e relacionamentos em evidência na recuperação de informação

Gonzalez, Marco Antonio Insaurriaga

dc.contributor.advisor	Lima, Jose Valdeni de	pt_BR
dc.contributor.author	Gonzalez, Marco Antonio Insaurriaga	pt_BR
dc.date.accessioned	2007-06-06T18:51:25Z	pt_BR
dc.date.issued	2005	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/5962	pt_BR
dc.description.abstract	Muitas abordagens para recuperação de informação (RI) assumem duas hipóteses: (i) cada termo de um documento é estatisticamente independente de todos os outros termos no texto, e (ii) métodos lingüísticos são de difícil aplicação nesta área. Contudo, há regularidades lingüísticas, produzidas pelas dependências entre termos, que precisam ser consideradas quando um texto é representado, e a representação de textos é crucial para aplicações que utilizam processamento da linguagem natural, como a RI. Um texto é mais do que uma simples seqüência de caracteres ou palavras. As palavras apresentam características morfológicas e relações de coesão que não podem ser esquecidas na descrição dos conceitos presentes no texto. Nesse sentido, um novo modelo com dependência de termos para a RI, denominado TR+, é proposto. Ele inclui: (i) nominalização, como processo de normalização lexical, e identificação de relações lexicais binárias (RLBs) e (ii) novas fórmulas para cálculo do peso das unidades de indexação (descritores). Essas fórmulas se baseiam no conceito de evidência, que leva em conta, além da freqüência de ocorrência, os mecanismos de coesão do texto. O modelo também inclui operadores Booleanos na consulta, para complementar a especificação da dependência de termos. Avaliações experimentais foram realizadas para demonstrar que (i) a nominalização apresenta melhores resultados em relação aos processos de normalização lexical usuais, (ii) a aquisição de informação lingüística, através de RLBs, e o uso de consultas Booleanas contribuem para a especificação de dependência de termos, e (iii) o cálculo da representatividade dos descritores baseado em evidência apresenta vantagens em relação ao cálculo baseado em freqüência de ocorrência. Os experimentos relatados indicam que esses recursos melhoram os resultados de sistemas de RI.	pt_BR
dc.format.mimetype	application/pdf
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Armazenamento : Dados	pt_BR
dc.subject	Recuperacao : Informacao	pt_BR
dc.title	Termos e relacionamentos em evidência na recuperação de informação	pt_BR
dc.type	Tese	pt_BR
dc.contributor.advisor-co	Lima, Vera Lucia Strube de	pt_BR
dc.identifier.nrb	000478320	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Computação	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2005	pt_BR
dc.degree.level	doutorado	pt_BR

Ficheros en el ítem

Nombre:: 000478320.pdf
Tamaño:: 1.071Mb
Formato:: PDF
Descripción:: Texto completo

Ver

Este ítem está licenciado en la Creative Commons License

Ciencias Exactas y Naturales (5129)

Computación (1764)

Mostrar el registro sencillo del ítem