Identificação e cadastro de medidores de energia elétrica utilizando técnicas de aprendizagem de máquina
Fecha
2023Autor
Tutor
Nivel académico
Grado
Tipo
Materia
Resumo
Laboratórios de metrologia legal são instalações responsáveis por garantir a conformidade e precisão das medições realizadas em diversos setores da sociedade, como comércio, indústria e saúde. O laboratório de Verificação Metrológica do LABELO - PUCRS recebe cerca de 3000 medidores de energia elétrica por mês, sendo o tempo médio para cadastro de seus dados de identificação, calculado ao longo de 2 meses, igual a 5 minutos e 25 segundos. Uma das etapas do cadastro é efetuar um registro fotográf ...
Laboratórios de metrologia legal são instalações responsáveis por garantir a conformidade e precisão das medições realizadas em diversos setores da sociedade, como comércio, indústria e saúde. O laboratório de Verificação Metrológica do LABELO - PUCRS recebe cerca de 3000 medidores de energia elétrica por mês, sendo o tempo médio para cadastro de seus dados de identificação, calculado ao longo de 2 meses, igual a 5 minutos e 25 segundos. Uma das etapas do cadastro é efetuar um registro fotográfico da amostra. Este projeto busca extrair da imagem os dados em texto para preencher 10 campos de cadastro e efetuar o preenchimento deste automaticamente. A principal ferramenta utilizada é o software de código aberto Tesseract, motor de reconhecimento óptico de caracteres (OCR) que será utilizado em série com algoritmos de aprendizagem de máquina como SVM, Naive Bayes e Random Forests, além de técnicas clássicas, para classificar os textos extraídos entre os campos de cadastro do medidor. A pesquisa culminou no desenvolvimento de três modelos finais (SVM, um modelo baseado em léxico e um modelo híbrido SVM que avaliava as saídas do baseado léxico) com 77,22%, 68,12% e 97,01% de taxa de acerto para classificação de textos extraídos de imagens de medidores de energia elétrica. Estes modelos foram comparados em termos de desempenho e complexidade, a fim de determinar se uma abordagem utilizando machine learning era de fato necessária. Por fim, concluiu-se que o modelo híbrido seria a melhor opção no contexto desta pesquisa para atuar na classificação de palavras para cadastro automático dos medidores. ...
Abstract
Legal metrology laboratories are facilities responsible for ensuring the compliance and accuracy of measurements carried out in various sectors of society, such as commerce, industry and health. The LABELO - PUCRS Metrological Verification laboratory receives about 3000 electricity meters per month, with the average time to register their identification data, calculated over 2 months, equal to 5 minutes and 25 seconds. One of the registration steps is to carry out a photographic record of the s ...
Legal metrology laboratories are facilities responsible for ensuring the compliance and accuracy of measurements carried out in various sectors of society, such as commerce, industry and health. The LABELO - PUCRS Metrological Verification laboratory receives about 3000 electricity meters per month, with the average time to register their identification data, calculated over 2 months, equal to 5 minutes and 25 seconds. One of the registration steps is to carry out a photographic record of the sample. This project seeks to extract text data from the image to fill in 10 registration fields and fill them in automatically. The main tool used is the open source software Tesseract, an optical character recognition (OCR) engine that will be used in series with machine learning algorithms such as SVM, Naive Bayes and Random Forests, in addition to classic techniques, to classify the extracted texts between the meter registration fields. The research culminated in the development of three final models (SVM, a lexicon-based model and a hybrid SVM model that evaluated the lexicon-based outputs) with 77.22%, 68.12% and 97.01% rate of success for classifying texts extracted from images of electric energy meters. These models were compared in terms of performance and complexity, in order to determine if an approach using machine learning was indeed necessary. Finally, it was concluded that the hybrid model would be the best option in the context of this research to act in the classification of words for the automatic registration of meters. ...
Institución
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Curso de Engenharia Elétrica.
Colecciones
-
Tesinas de Curso de Grado (37362)Tesinas Ingenierías (5855)
Este ítem está licenciado en la Creative Commons License