Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
Visualizar/abrir
Data
2010Autor
Tipo
Resumo
A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresen ...
A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web. ...
Abstract
The content quality of Web pages can be determined partially by indicators such as authorship, presence of references and publisher reputation. This paper discusses the application of information extraction techniques on the identification of quality indicators, specifically authorship. Unlike other extraction techniques, the techniques of our work, try to make the extraction without consider the structure of Web pages. The final goal of our work is to create tools to assess the quality of web ...
The content quality of Web pages can be determined partially by indicators such as authorship, presence of references and publisher reputation. This paper discusses the application of information extraction techniques on the identification of quality indicators, specifically authorship. Unlike other extraction techniques, the techniques of our work, try to make the extraction without consider the structure of Web pages. The final goal of our work is to create tools to assess the quality of web pages that have topics related to health. In this sense, the goal is to use the results of extraction to populate an ontology where are defined quality criteria for web pages. ...
Contido em
Cadernos de informática. Vol. 5, n. 1 (2010), p. 77-88
Origem
Nacional
Coleções
-
Artigos de Periódicos (40281)Ciências Exatas e da Terra (6158)
Este item está licenciado na Creative Commons License