A computational-linguistic-based approach to support the analysis of the discursive configuration of violence on social media

Research focused on the study of hate speech has grown in recent years; however, ap proaches capable of automatically detecting this type of content still need to be revised. These limitations are even more latent in languages with scarce data, such as Portuguese. This work proposes to study the use of linguistic indicators characteristic of hate speech associated with computational methods. Thus, we sought to evaluate the use of such indi cators to enable the framing of content conveyed on social networks from the perspective of Frame Semantics, considering the instantiation of a frame of symbolic violence as a way of proposing a means of interposing discourses intolerant. As a primary source of data, we consider Twitter. From this, data was extracted covering contexts related to sit uations that present topics considered potential carriers of hate speech. Thus, we focus on intolerant discourses linked to the occurrence of political gender violence. In order to analyze, we created a dataset of manually annotated political context tweets. From this set of data, we were able to validate the use of the proposed frame of symbolic violence as a way of representing discourses evaluated with a higher degree of intolerance. Also, based on this data set, we performed a series of classification experiments to identify intoler ant characteristics associated with hate speech. Based on this identification, we classified potential tweets with intolerant speech. To carry out the analysis of the data resulting from this study, we used a mixed method of research (quali-quanti) approach which, in its outcome, leads us to point out contributions of both scientific and social impact with which we seek to enrich the development of studies centered on social networks, with a focus on discourses potentially intolerant texts written in Brazilian Portuguese, also tak ing into account the user’s perception of the content generated on social networks and its repercussions on daily life. ...

Resumo

Pesquisas voltadas ao estudo do discurso de ódio cresceram nos últimos anos; no entanto, as abordagens capazes de detectar automaticamente esse tipo de conteúdo ainda apresentam limitações significativas. Essas limitações são ainda mais latentes em línguas com dados escassos, como a língua portuguesa. Este trabalho propõe-se ao estudo do uso de indicadores linguísticos característicos a discursos de ódio associados a métodos com putacionais. Assim, buscou-se avaliar a utilização de tais indicadores para possibilitar o enquadramento dos conteúdos veiculados nas redes sociais na perspectiva da Semântica de Frames, considerando a instanciação de um frame de violência simbólica como forma de propor um meio de interpor discursos intolerantes. Como fonte primária de dados, con sideramos o Twitter. A partir disso foi feita uma extração de dados abrangendo contextos ligados a situações as quais apresentam temas considerados potencialmente portadores de discurso de ódio. Deste modo, focamos em discursos intolerantes ligados à ocorrência violência política de gênero. De forma a analisar, criamos um dataset de tweets de con texto político manualmente anotados. A partir deste conjunto de dados, pudemos validar o uso do frame proposto de violência simbólica como uma forma de representar discur sos avaliados com um maior grau de intolerância. Também a partir deste conjunto de dados realizamos uma série de experimentos de classificação com o intuito de identificar a presença de características intolerantes associadas a discursos de ódio, e a partir dessa identificação classificar potenciais tweets com discurso intolerante. Para realizar a análise dos dados resultantes deste estudo fizemos uso de uma abordagem quali-quantitativa a qual em seu desfecho nos leva apontar contribuições tanto de impacto científico quanto social, com os quais buscamos enriquecer o desenvolvimento estudos centrados em re des sociais, com foco em discursos potencialmente intolerantes escritos em português do Brasil, levando também a percepção do considerando sobre o conteúdo gerado nas redes sociais e suas repercussões no cotidiano. ...

Institución

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.

Colecciones

Ciencias Exactas y Naturales (5196)

Computación (1786)

Otras opciones

Mostrar todos los metadatos

Estatísticas

Este ítem está licenciado en la Creative Commons License