Sistemática para o desenvolvimento e manutenção de inferências
dc.contributor.advisor | Trierweiler, Jorge Otávio | pt_BR |
dc.contributor.author | Santos, Pedro Victor José de Lima | pt_BR |
dc.date.accessioned | 2024-08-07T06:13:10Z | pt_BR |
dc.date.issued | 2023 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/277006 | pt_BR |
dc.description.abstract | Os processos industriais modernos buscam constantemente uma produção mais segura, mais limpa e mais eficiente em termos energéticos. Para isso, sistemas avançados de monitoramento e controle vêm ganhando destaque nas fábricas e refinarias de petróleo. No entanto, processos industriais enfrentam problemas na medição de algumas variáveis, como por exemplo, a qualidade dos produtos, concentração dos componentes. O uso de analisadores em linha ou de medições laboratoriais não viabiliza o controle direto, por conta do tempo de amostragem e incerteza das medições dos analisadores. Para contornar esse problema e finalmente gerar informações frequentes e confiáveis, inferências são utilizadas. Seu desenvolvimento e manutenção ainda podem ser complexos em muitos casos, sendo uma nova metodologia proposta neste trabalho. Algumas técnicas de machine learning são apresentadas e utilizadas, bem como uma nova metodologia para segregação de dados, que agrupa as amostras com o método k-means e as seleciona aplicando y-rank nos clusters gerados. Essa técnica, k-rank, se mostrou mais eficiente do que o y-rank em seleções de dados com multiplicidade de soluções. Em seguida, a metodologia proposta para o desenvolvimento das inferências é detalhada, a qual é separada em etapas, cujo objetivo é melhorar a qualidade do modelo final. A primeira etapa, pré-processamento dos dados, é responsável pela lapidação dos dados. Posteriormente os dados são separados em conjuntos de calibração e teste, utilizando a metodologia k-rank. Em seguida os modelos são construídos através de métodos (Ridge, Lasso, Lars, e algoritmos de busca) que realizam a seleção de variáveis, descartando as variáveis desnecessárias aos modelos, os quais são validados utilizando diversas métricas de avaliação. Essa metodologia é testada com dados de uma simulação rigorosa de uma unidade de separação de propeno/propano. Essa unidade tem o objetivo de produzir propeno com pureza de 99,6%, a partir de uma carga de GLP sendo composta por três colunas de destilação. Os resultados obtidos mostram que é possível estimar as concentrações dos componentes-chave com elevado grau de confiança para ajudar no controle do processo. Para isso foram criadas expansões polinomiais com as variáveis de processo disponíveis, e foram criados modelos com parâmetros lineares, porém com características não lineares. Baseado na metodologia proposta, conclui-se que foi possível estimar as concentrações chave para o controle da unidade. Entretanto, em algumas situações de concentrações muito baixas o erro foi demasiado, como na coluna T-03, para a estimativa de propano no topo. Mas percebe-se que para concentrações acima de 0,0002 kg/kg de propano no topo dessa coluna, pode-se estimar com um erro máximo deaproximadamente 16%. E como a coluna propõe uma pureza de 99,6% de propeno, o erro para concentrações próximas de 0,004 kg/kg de propano ainda é menor. Pois quanto mais baixa a concentração de propano, maior o erro da sua estimativa. Já para as colunas T-01 e T-02, as variáveis foram estimadas com boa acurácia, com erros percentuais médios abaixo de 2% para todas as concentrações estimadas. | pt_BR |
dc.description.abstract | Modern industrial processes constantly seek safer, cleaner and more energy-efficient production. To this end, advanced monitoring and control systems have been gaining prominence in oil factories and refineries. However, industrial processes face problems in measuring some variables, such as product quality and component concentration. The use of in-line analyzers or laboratory measurements does not enable direct control, due to the sampling time and uncertainty of analyzer measurements. To overcome this problem and finally generate frequent and reliable information, inferences are used. Its development and maintenance can still be complex in many cases, and a new methodology is proposed in this work. Some machine learning techniques are presented and used, as well as a new methodology for data segregation, which groups samples with the k-means method and selects them by applying y-rank to the generated clusters. This technique, k-rank, proved to be more efficient than y-rank in data selections with a multiplicity of solutions. Next, the proposed methodology for developing inferences is detailed, which is separated into stages, the objective of which is to improve the quality of the final model. The first step, data pre-processing, is responsible for polishing the data. Subsequently, the data is separated into calibration and test sets, using the k-rank methodology. The models are then built using methods (Ridge, Lasso, Lars, and search algorithms) that perform the selection of variables, discarding unnecessary variables from the models, which are validated using various evaluation metrics. This methodology is tested with data from a rigorous simulation of a propylene/propane separation unit. This unit aims to produce propylene with a purity of 99.6%, from an LPG charge consisting of three distillation columns. The results obtained show that it is possible to estimate the concentrations of key components with a high degree of confidence to help control the process. For this, polynomial expansions were created with the available process variables, and models were created with linear parameters, but with non-linear characteristics. Based on the proposed methodology, it is concluded that it was possible to estimate the key concentrations for controlling the unit. However, in some situations of very low concentrations the error was too much, as in column T-03, for the estimate of propane at the top. But it can be seen that for concentrations above 0.0002 kg/kg of propane at the top of this column, it can be estimated with a maximum error of approximately 16%. And as the column proposes a purity of 99.6% propylene, the error for concentrations close to 0.004 kg/kg of propane is even smaller. Because the lower the propane concentration, the greater the error in your estimate. For columns T-01 and T-02, the variables were estimated with good accuracy, with average percentage errors below 2% for all estimated concentrations. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Processos industriais | pt_BR |
dc.subject | Inferência estatística | pt_BR |
dc.subject | Processamento de dados | pt_BR |
dc.title | Sistemática para o desenvolvimento e manutenção de inferências | pt_BR |
dc.type | Dissertação | pt_BR |
dc.contributor.advisor-co | Farenzena, Marcelo | pt_BR |
dc.identifier.nrb | 001206759 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Escola de Engenharia | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Engenharia Química | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2023 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Este item está licenciado na Creative Commons License
-
Engenharias (7412)Engenharia Química (516)