Show simple item record

dc.contributor.authorFinatto, Maria José Bocornypt_BR
dc.contributor.authorLopes, Lucelenept_BR
dc.contributor.authorSilva, Alena Ciulla ept_BR
dc.date.accessioned2017-10-11T04:21:23Zpt_BR
dc.date.issued2015pt_BR
dc.identifier.issn1980-5799pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/169396pt_BR
dc.description.abstractEste trabalho apresenta um estudo em que técnicas de Processamento de Linguagem Natural (PLN) e de Linguística de Corpus (LC) são utilizadas para extrair e estruturar termos relacionados a conceitos importantes de Saussure no texto em português do Curso de Linguística Geral (CLG). Tomando o CLG como um corpus, busca-se um método de representação automática de conteúdo através de ferramentas computacionais. Uma vez submetido ao parser PALAVRAS, um etiquetador morfossintático para a língua portuguesa, o corpus do CLG é processado pela ferramenta extratora de sintagmas nominais relevantes, denominada ExATOlp, que implementa diversas técnicas de PLN de base linguística e de base estatística. Em seguida, são geradas listas e gráficos hierarquizados dos sintagmas nominais do CLG, elencados pela ferramenta como os mais específicos/relevantes do corpus em questão. Esses resultados são comparados com dados gerados pela ferramenta AntConc, ferramenta de acesso livre bastante empregada em trabalhos de LC, aplicada ao mesmo corpus. Os resultados mostram o potencial da ferramenta ExATOlp para trabalhos em LC e para o levantamento de dados lexicais para estudos terminológicos, para a mineração de dados e para a geração de ontologias em língua portuguesa.pt_BR
dc.description.abstractThis paper presents a study based on Natural Language Processing techniques (PLN) and Corpus Linguistics (CL) approaches to extract terms related to important saussurean concepts in the Brazilian Portuguese edition of the Course in General Linguistics. Taking the CGL as a corpus, we aim at an automatic representation method of content through computer tools. Once submitted to the parser PALAVRAS, a morphossyntatic tagger, the corpus is processed by ExATOlp, a tool implementing various linguistic and statistically based NLP techniques. The tool generates hierarchical lists and charts of noun phrases, which are organized according to their specificity / relevance in the target corpus. These lists are then compared to data generated by AntConc - a free access tool quite used in LC approaches - applied to the same corpus. The results show the potential of ExATOlp in works on LC and in colleting lexical data for terminology studies, data mining and generation of ontologies in Portuguese.en
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.relation.ispartofDomínios de lingu@gem. Uberlândia, MG. Vol. 9, n. 2 (abr./jun. 2015), p. [40]-55pt_BR
dc.rightsOpen Accessen
dc.subjectAutomatic extraction of termsen
dc.subjectSaussure, Ferdinand de, 1857-1913. Curso de lingüística geralpt_BR
dc.subjectLingüística de corpuspt_BR
dc.subjectCourse in general linguisticsen
dc.subjectSaussureen
dc.subjectLinguagem naturalpt_BR
dc.subjectLinguísticapt_BR
dc.titleExtração automática de candidatos a termos do Curso de Linguística Geral com apoio de recursos da linguística de corpus e do processamento de linguagem naturalpt_BR
dc.title.alternativeAutomatic extraction of term candidates from Course in General Linguistics with resources from corpus linguistics and natural language processing en
dc.typeArtigo de periódicopt_BR
dc.identifier.nrb001047479pt_BR
dc.type.originNacionalpt_BR


Files in this item

Thumbnail
   

This item is licensed under a Creative Commons License

Show simple item record