Estudos sobre a aplicação de autoencoder para construção de inferências na indústria química

Menegolla, Henrique Binotto

Visualizar/abrir

Texto completo (3.531Mb)

Data

2019

Autor

Menegolla, Henrique Binotto

Orientador

Trierweiler, Jorge Otávio

Farenzena, Marcelo

Nível acadêmico

Mestrado

Resumo

Na indústria moderna os processos são otimizados para uma produção mais segura, mais limpa e mais eficiente em termos energéticos. Para isso, sistemas avançados de monitoramento e controle vêm ganhando destaque nas fábricas e refinarias de petróleo. No entanto, processos industriais enfrentam problemas na medição de algumas variáveis, como por exemplo, a qualidade dos produtos, concentração dos componentes. O uso de analisadores em linha ou de medições laboratoriais não viabiliza o controle direto, por conta do tempo de amostragem e incerteza das medições dos analisadores. Para contornar esse problema e gerar informações frequentes e confiáveis, este trabalho faz um estudo de autoencoder, uma ferramenta baseada em redes neurais, que ainda não foi estudada visando o desenvolvimento e a manutenção de inferências. Este trabalho apresenta algumas técnicas de machine learning visando o tratamento prévio dos dados e em seguida, é feito o treinamento de uma rede neural de aprendizagem não-supervisionada que através da compressão e descompressão das entradas, chamada de autoencoder, que cria um espaço latente de menor dimensão capaz de concentrar as informações contidas nos dados empregados no desenvolvimento das inferências. A metodologia proposta para o desenvolvimento das inferências é feita a partir deste espaço reduzido pelo autoencoder. O espaço latente do autoencoder pode ser visto como a generalização dos componentes principais obtidos através da metodologia PCA. Desta forma, também são desenvolvidas inferências utilizando a metodologia PCA para comparação entre a mais utilizada atualmente e o objeto de estudo deste trabalho. A primeira etapa, é feito o pré-processamento dos dados. Posteriormente os dados são separados em conjuntos de treino, validação e teste, utilizando a metodologia k-rank. Em seguida os modelos são construídos através de regressões lineares com métodos (Ridge e Lasso, Lars) que realizam a seleção de variáveis, impondo restrições às variáveis desnecessárias aos modelos, os quais são validados utilizando diversas métricas de avaliação.Essa metodologia é testada com dois estudos de caso. Um com dados gerados artificialmente de modo a se ter uma base de dados com relações entre variáveis conhecida. E outro com dados de uma simulação em Aspen Plus de uma unidade de separação de propeno/propano. Essa unidade tem o objetivo de produzir propeno com pureza de 99,6%, a partir de uma carga de GLP. A qual é composta por três colunas de destilação. Na primeira coluna, retira-se os compostos pesados pelo fundo e a corrente de topo segue para a segunda coluna que tem o objetivo de retirar o etano da corrente. Com isso, a corrente de fundo dessa coluna segue para uma terceira coluna, a qual separa o propeno do propano. As informações úteis para ajudar no controle da unidade são: concentração de pesados no topo da primeira coluna para que possa ser reduzida a quantidade dessa impureza; na segunda coluna é importante reduzir o propeno que escapa junto com o etano pelo topo da coluna, para aumentar a produção final da planta; e na terceira coluna é importante manter a corrente de topo dentro da especificação, com isso é necessário estimar a impureza de propano no topo da coluna. Os resultados obtidos não conseguem apontar para uma clara superioridade na qualidade das inferências geradas em relação ao método com PCA dentro dos casos estudados com a metodologia proposta. ...

Abstract

In the modern industry, processes are constantly being optimized to seeki safer, cleaner and more energy-efficient production. To this end, advanced monitoring and control systems have been gaining prominence in chemical factories and refineries. However, industrial processes face problems in the measurement of some variables, such as product quality and component concentration. The use of in-line analyzers or laboratory measurements does not allow direct control, due to the sampling time and uncertainty of the analyzer measurements. To circumvent this problem and finally generate frequent and reliable information, this work studies the autoencoder, a tool based on neural networks not yet applied on the development and maintenance of inferences. Some techniques of machine learning will be presented and used, as pretreatment of data following the training of a neural network of unsupervised learning through the compression and decompression of the input information, called autoencoder, produces a latent space with lower dimension concentrating the information winthin the data and therefore being capable of developing soft-sensors. The proposed methodology for the development of the sof-sensors is to use the reduced space by the autoencoder to predict the desired variables o the system. The latent space of the autoencoder can be seen as a generalization of the principal components of the PCA methodology. Then, a comparison of the results obtained with PCA, the current standard and the autoencoder is made to evaluate the object of this work. The first step is the pre-processing of the data. Subsequently the data are separated into calibration and test sets using the k-rank methodology. Then the models are constructed through linear regression with methods (Ridge and Lasso-Lars) that perform the selection of variables, discarding unnecessary variables to the models, which will be validated using several evaluation metrics. This methodology is tested with two case studies. One with artificial data generated with known relation between its variables. And one with data from an Aspen simulation of a propene/propane separation unit. This unit has the objective of producing propene with purity of 99.6%, from a load of GLP. It is composed of three columns of distillation. In the first column, the heavy compounds are withdrawn from the bottom and the top stream goes to the second column which has the purpose of removing the ethane from the stream. Thus, the bottom stream of this column goes to a third column, which separates the propene from the propane. The useful information to help control the unit are: concentration of heavy at the top of the first column so that the amount of this impurity can be reduced; in the second column it is important to reduce propene that escapes along with ethane at the top of the column to increase the final production of the plant; and in the third column it is important to maintain the top current within the specification, whereby it is necessary to estimate the impurity of propane at the top of the column. The results show that at this point there is no clear superiority in the quality of the predictions when comparing to the ones of the PCA method for the case-studies and the proposed methodology. ...

Instituição

Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Programa de Pós-Graduação em Engenharia Química.

Coleções

Engenharias (7730)

Engenharia Química (538)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License