Uma ferramenta de processamento de linguagem natural para extração de dados em prescrições médicas eletrônicas
dc.contributor.advisor | Tavares, Anderson Rocha | pt_BR |
dc.contributor.author | Santoro, Jonatas Tschá | pt_BR |
dc.date.accessioned | 2023-07-12T03:34:34Z | pt_BR |
dc.date.issued | 2023 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/262030 | pt_BR |
dc.description.abstract | Este trabalho apresenta uma ferramenta de processamento de linguagem natural, destinada à extração de dados em prescrições médicas eletrônicas. O principal objetivo é proporcionar eficiência e praticidade, permitindo a extração automática de informações relevantes contidas nas prescrições, como medicamento, concentração, dosagem, frequência, prazo e observações. Para atingir este objetivo, amostras de prescrições médicas eletrô nicas no formato PDF foram coletadas, pré-processadas e rotuladas com as entidades re queridas, permitindo a geração de novas amostras. Posteriormente, procedeu-se ao ajuste fino de um modelo de reconhecimento de entidades nomeadas (NER), utilizando a bibli oteca de processamento de linguagem natural SpaCy. Com o auxílio do modelo treinado, desenvolveu-se uma interface de programação de aplicação (API) que emprega o modelo para identificar as entidades nas prescrições médicas e conduz um pós-processamento mediante regras lógicas e expressões regulares, visando a validação das entidades detec tadas e a padronização dos resultados. O resultado final consiste nas entidades extraídas e suas informações correspondentes, com a possibilidade de ser prontamente aproveitado em aplicativos de saúde através do uso da API. | pt_BR |
dc.description.abstract | This paper presents a natural language processing tool designed for data extraction from electronic medical prescriptions. The main goal is to provide efficiency and convenience, allowing for the automatic extraction of relevant information contained in prescriptions, such as medication, concentration, dosage, frequency, duration, and observations. To achieve this goal, electronic medical prescription samples in PDF format were collected, pre-processed, and labeled with the required entities, allowing for the generation of new samples. Subsequently, fine-tuning of a named entity recognition (NER) model was performed using the SpaCy natural language processing library. With the assistance of the trained model, an application programming interface (API) was developed that em ploys the model to identify entities in medical prescriptions and conducts post-processing through logical rules and regular expressions, aiming to validate the detected entities and standardize the results. The final outcome consists of the extracted entities and their corre sponding information, with the possibility of being readily utilized in health applications through the use of the API. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | eng | pt_BR |
dc.rights | Open Access | en |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Electronic medical prescriptions | en |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Named entity recognition | en |
dc.title | Uma ferramenta de processamento de linguagem natural para extração de dados em prescrições médicas eletrônicas | pt_BR |
dc.title.alternative | A natural language processing tool for data extraction from electronic medical prescriptions | en |
dc.type | Trabalho de conclusão de graduação | pt_BR |
dc.identifier.nrb | 001172798 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2023 | pt_BR |
dc.degree.graduation | Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado | pt_BR |
dc.degree.level | graduação | pt_BR |
Files in this item
This item is licensed under a Creative Commons License