Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
dc.contributor.advisor | Heuser, Carlos Alberto | pt_BR |
dc.contributor.author | Silveira, Iraci Cristina da | pt_BR |
dc.date.accessioned | 2007-06-06T17:20:39Z | pt_BR |
dc.date.issued | 2001 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/2178 | pt_BR |
dc.description.abstract | Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados. | pt_BR |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Armazenamento : Dados | pt_BR |
dc.subject | Recuperacao : Informacao | pt_BR |
dc.subject | Banco : Dados semi-estruturados | pt_BR |
dc.subject | Extração semântica | pt_BR |
dc.title | Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais | pt_BR |
dc.type | Dissertação | pt_BR |
dc.identifier.nrb | 000315470 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2001 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Este item está licenciado na Creative Commons License
-
Ciências Exatas e da Terra (5129)Computação (1764)