Pylinguistics : an open source library for readability assessment of texts written in Portuguese
View/ Open
Date
2016Author
Advisor
Co-advisor
Academic level
Graduation
Title alternative
Pylinguistics : uma biblioteca open source para avaliação de inteligibilidade de textos escritos em Português
Subject
Abstract in Portuguese (Brasil)
Avaliação de inteligibilidade é um processo importante na simplificação automática de texto, visando computar um conjunto de métricas capazes de mensurar a complexidade de um texto. Nesse trabalho proponho o desenvolvimento de uma ferramenta de código aberto voltada para a medição de inteligibilidade de textos na língua portuguesa. Reporto o desenvolvimento da mesma, realizo uma avaliação comparativa, e obtenho resultados satisfatórios com sua performance. Para ilustrar as possibilidades da fer ...
Avaliação de inteligibilidade é um processo importante na simplificação automática de texto, visando computar um conjunto de métricas capazes de mensurar a complexidade de um texto. Nesse trabalho proponho o desenvolvimento de uma ferramenta de código aberto voltada para a medição de inteligibilidade de textos na língua portuguesa. Reporto o desenvolvimento da mesma, realizo uma avaliação comparativa, e obtenho resultados satisfatórios com sua performance. Para ilustrar as possibilidades da ferramenta, esse trabalho também apresenta uma análise empírica da inteligibilidade do jornalismo científico brasileiro. ...
Abstract
Readability assessment is an important process in automatic text simplification that aims to measure the text complexity by computing a set of metrics. In this work, I propose the development of a tool with a set of 38 open-source metrics to readability assessment of texts written in Portuguese. I report its development as well as perform a comparative assessment of the tool and obtain satisfactory results with its performance. To illustrate the possibilities of our tool, this work also present ...
Readability assessment is an important process in automatic text simplification that aims to measure the text complexity by computing a set of metrics. In this work, I propose the development of a tool with a set of 38 open-source metrics to readability assessment of texts written in Portuguese. I report its development as well as perform a comparative assessment of the tool and obtain satisfactory results with its performance. To illustrate the possibilities of our tool, this work also presents an empirical analysis of readability of Brazilian scientific news dissemination and text categorization. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Collections
This item is licensed under a Creative Commons License