Uma ferramenta de processamento de linguagem natural para extração de dados em prescrições médicas eletrônicas

Santoro, Jonatas Tschá

dc.contributor.advisor	Tavares, Anderson Rocha	pt_BR
dc.contributor.author	Santoro, Jonatas Tschá	pt_BR
dc.date.accessioned	2023-07-12T03:34:34Z	pt_BR
dc.date.issued	2023	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/262030	pt_BR
dc.description.abstract	Este trabalho apresenta uma ferramenta de processamento de linguagem natural, destinada à extração de dados em prescrições médicas eletrônicas. O principal objetivo é proporcionar eficiência e praticidade, permitindo a extração automática de informações relevantes contidas nas prescrições, como medicamento, concentração, dosagem, frequência, prazo e observações. Para atingir este objetivo, amostras de prescrições médicas eletrô nicas no formato PDF foram coletadas, pré-processadas e rotuladas com as entidades re queridas, permitindo a geração de novas amostras. Posteriormente, procedeu-se ao ajuste fino de um modelo de reconhecimento de entidades nomeadas (NER), utilizando a bibli oteca de processamento de linguagem natural SpaCy. Com o auxílio do modelo treinado, desenvolveu-se uma interface de programação de aplicação (API) que emprega o modelo para identificar as entidades nas prescrições médicas e conduz um pós-processamento mediante regras lógicas e expressões regulares, visando a validação das entidades detec tadas e a padronização dos resultados. O resultado final consiste nas entidades extraídas e suas informações correspondentes, com a possibilidade de ser prontamente aproveitado em aplicativos de saúde através do uso da API.	pt_BR
dc.description.abstract	This paper presents a natural language processing tool designed for data extraction from electronic medical prescriptions. The main goal is to provide efficiency and convenience, allowing for the automatic extraction of relevant information contained in prescriptions, such as medication, concentration, dosage, frequency, duration, and observations. To achieve this goal, electronic medical prescription samples in PDF format were collected, pre-processed, and labeled with the required entities, allowing for the generation of new samples. Subsequently, fine-tuning of a named entity recognition (NER) model was performed using the SpaCy natural language processing library. With the assistance of the trained model, an application programming interface (API) was developed that em ploys the model to identify entities in medical prescriptions and conducts post-processing through logical rules and regular expressions, aiming to validate the detected entities and standardize the results. The final outcome consists of the extracted entities and their corre sponding information, with the possibility of being readily utilized in health applications through the use of the API.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Electronic medical prescriptions	en
dc.subject	Processamento de linguagem natural	pt_BR
dc.subject	Named entity recognition	en
dc.title	Uma ferramenta de processamento de linguagem natural para extração de dados em prescrições médicas eletrônicas	pt_BR
dc.title.alternative	A natural language processing tool for data extraction from electronic medical prescriptions	en
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.identifier.nrb	001172798	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2023	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Files in this item

Name:: 001172798.pdf
Size:: 1.254Mb
Format:: PDF
Description:: Texto completo

View/Open

This item is licensed under a Creative Commons License

Final Papers - Undergraduate Courses (37618)

Computer Science - Undergraduate degree (1025)

Show simple item record