Mostrar el registro sencillo del ítem
Anotação morfológica automática de corpus de língua falada : desafios ao Aelius
dc.contributor.author | Othero, Gabriel de Ávila | pt_BR |
dc.contributor.author | Ayres, Mônica Rigo | pt_BR |
dc.date.accessioned | 2015-05-26T02:00:59Z | pt_BR |
dc.date.issued | 2014 | pt_BR |
dc.identifier.issn | 1983-3652 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/117105 | pt_BR |
dc.description.abstract | Apresentamos, neste artigo, nosso trabalho de anotação morfológica automática de trechos de um corpus de língua falada – pertencentes ao projeto Varsul –, utilizando um etiquetador automático morfossintático gratuito, o Aelius, em 20 textos, perfazendo um total de 154.530 palavras. Basicamente, apresentamos a ferramenta de anotação automática, o processo de análise morfossintática automática efetuada pelo anotador, o trabalho de revisão manual da etiquetagem automática e as sugestões de melhorias para tratar especificamente de aspectos da oralidade. A partir dos erros do etiquetador, buscamos depreender certos padrões de anotação para superar limitações de desempenho apresentadas pelo programa, propondo algumas sugestões de implementações para que o Aelius etiquete de maneira ainda mais satisfatória um corpus de língua falada. Tratamos especialmente dos casos de interjeições, aféreses, onomatopeias e marcadores conversacionais. | pt_BR |
dc.description.abstract | In this paper, we present the results of our work on automatic morphological annotation using the free morphosyntatic Aelius tagger. The excerpts analyzed were taken from a corpus of spoken language – part of the VARSUL project. We present 20 texts containing 154,530 words, which were automatically annotated and manually corrected. This paper also describes the Aelius tagger and our effort of manual reviewing the texts, as well as our suggestions for improving the tool, concerning aspects of oral texts tagging. We assessed the performance of the tagger at the morphosyntactic tagging of a spoken language corpus, an unprecedented challenge for the tool. Based on its errors, we try to infer certain patterns of annotation to overcome the limitations presented by the program. We also make suggestions in order to allow Aelius to tag spoken language corpora in a more effective way, specially when dealing with interjections, apheresis, onomatopoeia and conversational markers. | en |
dc.format.mimetype | application/pdf | |
dc.language.iso | por | pt_BR |
dc.relation.ispartof | Texto livre. Belo Horizonte, MG. Vol. 7, n. 2 (primavera 2014), f. 44-60 | pt_BR |
dc.rights | Open Access | en |
dc.subject | Aelius | pt_BR |
dc.subject | Tagger | en |
dc.subject | Lingüística de corpus | pt_BR |
dc.subject | Morphosyntactic tagging | en |
dc.subject | Corpus Linguistics | en |
dc.subject | Morfossintaxe | pt_BR |
dc.title | Anotação morfológica automática de corpus de língua falada : desafios ao Aelius | pt_BR |
dc.title.alternative | Morphological pos tagging in oral language corpus : challenges for Aelius | en |
dc.type | Artigo de periódico | pt_BR |
dc.identifier.nrb | 000966630 | pt_BR |
dc.type.origin | Nacional | pt_BR |
Ficheros en el ítem
Este ítem está licenciado en la Creative Commons License
-
Artículos de Periódicos (41542)Lingüística, Letras y Artes (2835)