Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia

Silva, Ana Carla Macedo da

View/Open

Texto completo (1.983Mb)

Date

2002

Author

Silva, Ana Carla Macedo da

Advisor

Oliveira, Jose Palazzo Moreira de

Academic level

Master

Abstract in Portuguese (Brasil)

Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma. ...

Institution

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.

Collections

Exact and Earth Sciences (5143)

Computation (1766)

Other options

Show all item metadata

Statistics

This item is licensed under a Creative Commons License