A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
Visualizar/abrir
Data
2022Autor
Orientador
Nível acadêmico
Mestrado
Tipo
Assunto
Resumo
Estruturas Lexicais (Lexical Frames) são sequências descontínuas de palavras que formam uma estrutura (frame) em torno de lacunas variáveis (slots) – por exemplo, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Tais unidades representam blocos formulaicos muito importantes na construção do discurso acadêmico (GRAY; BIBER, 2013). Diversas pesquisas já foram realizadas sobre linguagem formulaica em contextos acadêmicos (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Pouc ...
Estruturas Lexicais (Lexical Frames) são sequências descontínuas de palavras que formam uma estrutura (frame) em torno de lacunas variáveis (slots) – por exemplo, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Tais unidades representam blocos formulaicos muito importantes na construção do discurso acadêmico (GRAY; BIBER, 2013). Diversas pesquisas já foram realizadas sobre linguagem formulaica em contextos acadêmicos (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Poucos estudos, no entanto, tiveram como foco a análise funcional das ELs em resumos de diferentes áreas de especialidade, a partir de um modelo que combine princípios de duas grandes áreas: os Estudos sobre Gêneros do Discurso e a Linguística de Corpus. Nessa direção, este estudo investiga o uso e a distribuição das ELs utilizadas na realização linguística das funções retóricas expressas nas seções de resumos de três áreas do conhecimento: (1) Ciências da Computação e da Informação, (2) Física e (3) Medicina e Ciências da Saúde. Em especial, busca-se a identificação e a análise funcional dos referidos blocos formulaicos extraídos dos corpora, em uma abordagem dirigida por corpus (data-driven approach). Para tanto, foram compilados três corpora de resumos escritos em inglês, das áreas-alvo, publicados em periódicos revisados por pares. Cada corpus, com 1 milhão de palavras, foi compilado com a ferramenta AntCorGen (ANTHONY, 2019) e analisado por meio das ferramentas Sketch Engine (KILGARRIFF et al., 2004) e AntConc 4.0.10 (ANTHONY, 2022). Um total de 717 ELs foram extraídas dos três corpora estudados. Destas, 159 são da área das Ciências da Computação e da Informação; 154, da área da Física; e 404, da área da Medicina e das Ciências da Saúde. Quanto ao padrão retórico, foi possível constatar que as seções que são convencionais nos resumos estruturados das áreas-alvo são as mesmas elencadas por Swales e Feak (2009). A observação da amostra de 150 ELs, no que tange às funções retóricas que realizam nos resumos acadêmicos, indicou a existência de duas grandes categorias de unidades multipalavras descontínuas: (i) as ELs transparentes e (ii) as ELs opacas. As ELs transparentes representam as unidades que têm a sua função retórica mais facilmente identificável a partir da observação: (i) dos elementos fixos que constituem a sua estrutura; (ii) das palavras que preenchem as lacunas variáveis; e (iii) dos contextos de ocorrência. Quanto a sua tipologia, as ELs transparentes podem ser divididas em 2 tipos, as ELs transparentes retóricas (ELTR) e as ELs transparentes terminológicas (ELTT). As ELTRs realizam linguisticamente as funções retóricas expressas nos gêneros, particularmente as funções relativas à apresentação dos objetivos do trabalho, estando, por essa razão, mais vinculadas a um movimento ou a uma seção retórica. Tais estruturas apresentam, em sua composição, palavras lexicais que indicam função retórica (por exemplo, aim, purpose, results). As ELTTs mais vinculadas às áreas de especialidade realizam a função de referir termos, procedimentos e conceitos consagrados nas áreas especializadas. Quanto à frequência de ocorrência nos corpora, as ELTTs são menos frequentes do que as ELTRs, sendo necessários pontos de corte mais baixos para que possamos identificá-las. Essas estruturas apresentam, em sua composição, palavras lexicais que indicam vinculação a uma área de especialidade (por exemplo, risk, hazard patients). Sugere-se que os dados obtidos neste estudo sejam usados para subsidiar o ensino de Inglês para Fins Acadêmicos (IFA). ...
Abstract
Lexical Frames are discontinuous sequences of words that form a structure (frame) around variable gaps (slots) – for example, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Lexical Frames (LFs) have great pedagogical value for the production of written academic genres in different areas of expertise. Several studies have already been carried out on formulaic language in academic contexts (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Few studies, however, have focuse ...
Lexical Frames are discontinuous sequences of words that form a structure (frame) around variable gaps (slots) – for example, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Lexical Frames (LFs) have great pedagogical value for the production of written academic genres in different areas of expertise. Several studies have already been carried out on formulaic language in academic contexts (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Few studies, however, have focused on the functional analysis of LFs in abstracts from different specialized areas, based on a model that combines principles from two major areas: Studies on Discourse Genres and Corpus Linguistics. In this direction, this study investigates the use and distribution of the LFs used in the linguistic realization of the rhetorical functions expressed in the sections of abstracts of three areas of knowledge: (1) Computer and Information Sciences, (2) Physics and (3) Medicine and Health Sciences. In particular, the study seeks to identify and functionally analyze the aforementioned formulaic blocks extracted from the corpora, in a data-driven approach. To this end, three corpora of abstracts, written in English, from the target areas, published in peer-reviewed journals, were compiled. Each corpus, with 1 million words, was compiled with AntCorGen (ANTHONY, 2019) and analyzed using Sketch Engine (Kilgarriff et al., 2004) and AntConc 4.0.10 (ANTHONY, 2022). A total of 717 LFs were extracted from the three corpora studied. Of these, 159 are in the area of Computer and Information Sciences; 154, in the area of Physics; and 404, in the area of Medicine and Health Sciences. As for the rhetorical pattern, it was possible to verify that the sections that are conventional in the structured abstracts of the target areas are the same listed by Swales and Feak (2009). The observation of the sample of 150 LFs, regarding the rhetorical functions they perform in the abstracts, indicated the existence of two major categories of discontinuous multiword units: (i) the transparent LFs and (ii) the opaque LFs. The transparent LFs represent the units that have their rhetorical function more easily identifiable from the observation: (i) of the fixed elements that constitute their structure; (ii) the words that fill in the variable slots; and (iii) the contexts of occurrence. Regarding their typology, the transparent LFs can be divided into 2 types, the rhetorically transparent LFs (RTLF) and the terminologically transparent LFs (TTLF). The RTLFs linguistically perform the rhetorical functions expressed in the genres, especially the functions related to the presentation of the objectives of the work and, for this reason, they are more linked to a rhetorical move or section. They have, in their composition, lexical words that indicate rhetorical function (for example, aim, purpose, results). The TTLFs, more linked to the specialized areas, perform the function of referring to terms, procedures and concepts established in the specialized domains. As for the frequency of occurrence in the corpora, TTLFs are less frequent than RTLFs, requiring lower cut-off points so that they can be extracted from the corpus. They have, in their composition, lexical words that indicate a link to a specialized area (for example, risk, hazard patients). It is suggested that the data obtained in this study be used to support the teaching of English for Academic Purposes (EAP). ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Letras. Programa de Pós-Graduação em Letras.
Coleções
-
Linguística, Letras e Artes (2878)Letras (1771)
Este item está licenciado na Creative Commons License