Pylinguistics : an open source library for readability assessment of texts written in Portuguese
Visualizar/abrir
Data
2016Autor
Orientador
Co-orientador
Nível acadêmico
Graduação
Outro título
Pylinguistics : uma biblioteca open source para avaliação de inteligibilidade de textos escritos em Português
Assunto
Resumo
Avaliação de inteligibilidade é um processo importante na simplificação automática de texto, visando computar um conjunto de métricas capazes de mensurar a complexidade de um texto. Nesse trabalho proponho o desenvolvimento de uma ferramenta de código aberto voltada para a medição de inteligibilidade de textos na língua portuguesa. Reporto o desenvolvimento da mesma, realizo uma avaliação comparativa, e obtenho resultados satisfatórios com sua performance. Para ilustrar as possibilidades da fer ...
Avaliação de inteligibilidade é um processo importante na simplificação automática de texto, visando computar um conjunto de métricas capazes de mensurar a complexidade de um texto. Nesse trabalho proponho o desenvolvimento de uma ferramenta de código aberto voltada para a medição de inteligibilidade de textos na língua portuguesa. Reporto o desenvolvimento da mesma, realizo uma avaliação comparativa, e obtenho resultados satisfatórios com sua performance. Para ilustrar as possibilidades da ferramenta, esse trabalho também apresenta uma análise empírica da inteligibilidade do jornalismo científico brasileiro. ...
Abstract
Readability assessment is an important process in automatic text simplification that aims to measure the text complexity by computing a set of metrics. In this work, I propose the development of a tool with a set of 38 open-source metrics to readability assessment of texts written in Portuguese. I report its development as well as perform a comparative assessment of the tool and obtain satisfactory results with its performance. To illustrate the possibilities of our tool, this work also present ...
Readability assessment is an important process in automatic text simplification that aims to measure the text complexity by computing a set of metrics. In this work, I propose the development of a tool with a set of 38 open-source metrics to readability assessment of texts written in Portuguese. I report its development as well as perform a comparative assessment of the tool and obtain satisfactory results with its performance. To illustrate the possibilities of our tool, this work also presents an empirical analysis of readability of Brazilian scientific news dissemination and text categorization. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Coleções
-
TCC Ciência da Computação (1024)
Este item está licenciado na Creative Commons License