Mostrar registro simples

dc.contributor.advisorBalreira, Dennis Giovanipt_BR
dc.contributor.authorFritzen, Vinicius Josépt_BR
dc.date.accessioned2026-01-16T08:02:13Zpt_BR
dc.date.issued2025pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/300245pt_BR
dc.description.abstractAo longo da história, os meios impressos foram os principais veículos de informação. Nas últimas décadas, porém, eles vêm sendo gradualmente substituídos pelos meios digitais, que já se consolidaram como uma realidade cotidiana. Optical Character Recognition (OCR) é umatecnologia que permite a digitalização de textos, porém ela produz resultados com ruídos. Neste trabalho, é avaliado o potencial de Modelos de Linguagem de Larga Escala (LLMs) generativas, como o modelo Gemma 3, na correção de textos provenientes de OCRemportuguês brasileiro. Utilizando o dataset ESTER-Pt, é analisada a capacidade de alguns LLMs generativos de usar pistas contextuais para encontrar e corrigir erros causados pelo OCR. Como resultado, este trabalho demonstra que usando LLMs é possível obter uma taxa de erro de caracteres (CER) menor que o estado da arte em português, de 5,12 para 1,69.pt_BR
dc.description.abstractThroughout history, printed media have served as the primary conduit for disseminating information. In recent decades, however, digital media have taken precedence, firmly establishing themselves in everyday life. Optical Character Recognition (OCR) technology facilitates the digitization of text but frequently introduces errors during the process. This study investigates the effectiveness of generative Large Language Models (LLMs), like the model Gemma 3, in correcting OCR outputs in Brazilian Portuguese. Using the ESTER Pt dataset, we assess the models’ ability to leverage contextual information to identify and correct OCR-induced errors. The results demonstrate that LLMs can significantly outperform existing methods, achieving an improvement in character error rate (CER) over the current state of the art in Portuguese, reducing it from 5.12 to 1.69.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectReconhecimento óptico de caracterespt_BR
dc.subjectCorreção de texto pós-OCRpt_BR
dc.subjectRecuperação de texto digitalpt_BR
dc.titleAvaliação do uso de modelos de linguagem de larga escala para correção pós-reconhecimento óptico de caracteres em língua portuguesapt_BR
dc.title.alternativeEvaluating the use of large language models for optical character recognition post-correction in Portuguese pt
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb001290950pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2025pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples