Desenvolvimento de um recurso léxico com papéis semânticos para o português
Visualizar/abrir
Data
2013Tipo
Outro título
Developing a lexical resource annotated with semantic roles for Portuguese
Assunto
Resumo
Os objetivos deste estudo são os seguintes: apresentar uma metodologia para desenvolver um recurso léxico com informações semânticas; comparar papéis semânticos de verbos em linguagem especializada e não especializada; e observar a anotação de papéis semânticos por vários anotadores. Foram desenvolvidos dois experimentos relacionados à anotação de papéis semânticos em português: comparação de um corpus de linguagem especializada com um corpus de linguagem não especializada; e teste da concordân ...
Os objetivos deste estudo são os seguintes: apresentar uma metodologia para desenvolver um recurso léxico com informações semânticas; comparar papéis semânticos de verbos em linguagem especializada e não especializada; e observar a anotação de papéis semânticos por vários anotadores. Foram desenvolvidos dois experimentos relacionados à anotação de papéis semânticos em português: comparação de um corpus de linguagem especializada com um corpus de linguagem não especializada; e teste da concordância entre diversos anotadores na atribuição de papéis semânticos. Quanto aos resultados, observaram-se diferenças qualitativas entre os corpora estudados, sendo o apagamento de agentes um traço marcante do corpus especializado. A não concordância averiguada entre vários anotadores indica que a tarefa é complexa, requerendo mais treinamento ou uma maior simplificação da tarefa, o que não parece ser possível no atual estágio de desenvolvimento. ...
Abstract
The objectives of this study are as follows: to present a methodology for the development of a lexical resource with semantic information; to compare semantic roles in specialized and nonspecialized language; and to observe the semantic role labeling (SRL) made by a group of annotators. Two experiments revolving around SRL in Portuguese were developed: a comparison between data in specialized and non-specialized language corpora; and an annotation evaluation for verifying the agreement among mu ...
The objectives of this study are as follows: to present a methodology for the development of a lexical resource with semantic information; to compare semantic roles in specialized and nonspecialized language; and to observe the semantic role labeling (SRL) made by a group of annotators. Two experiments revolving around SRL in Portuguese were developed: a comparison between data in specialized and non-specialized language corpora; and an annotation evaluation for verifying the agreement among multiple annotators for the task of SRL. As for results, a qualitative difference between the corpora was observed, and the most prominent feature was the omission of agents in specialized texts. There was little agreement among annotators, which points toward the necessity of more training, or a simplification of the task, which does not seem to be possible at this stage of development. ...
Contido em
Linguamática. Portugal. Vol. 5, n. 2 (dez. 2013), p. [23]-41
Origem
Estrangeiro
Coleções
-
Artigos de Periódicos (39565)Linguística, Letras e Artes (2690)
Este item está licenciado na Creative Commons License