A machine learning approach for petroleum production forecasting in a digital twin
View/ Open
Date
2024Advisor
Academic level
Master
Type
Subject
Abstract
Digital Twins (DTs), a forefront technology in Industry 4.0, find extensive applications in O&G, particularly in asset performance management. By virtually replicating a physical asset, DTs provide a digital platform for exploring various scenarios and problemsolving strategies without disrupting operational processes. Integrating DT principles and Machine Learning (ML) techniques holds significant promise for enhancing production forecasting capabilities in the O&G industry, enabling more info ...
Digital Twins (DTs), a forefront technology in Industry 4.0, find extensive applications in O&G, particularly in asset performance management. By virtually replicating a physical asset, DTs provide a digital platform for exploring various scenarios and problemsolving strategies without disrupting operational processes. Integrating DT principles and Machine Learning (ML) techniques holds significant promise for enhancing production forecasting capabilities in the O&G industry, enabling more informed decision-making and efficient production management. Traditional production forecasting methods in the industry face limitations such as dependence on expert experience, data availability, and computational costs. Leveraging ML algorithms offers a promising alternative to complex methods. In this work, we proposed a Proof of Concept (POC) digital twin component able to train ML petroleum forecasting models, execute them within what-if scenarios and present their results to end-users. We also gather results and raise insights from a model selection strategy executed by this DT component. This strategy investigated the impact on model performance of: (1) different lookback and horizon sizes for the training samples, (2) the use of future operational variables, and (3) the choice of different data sampling frequencies. The proposed architecture fulfilled the stakeholder’s requirements and serves as an adequate digital twin component for the upstream sector. Results of the model comparison framework showed that the ensemble tree-based model XGBoost performed better than deep learning techniques for this particular dataset. We found that the optimal training window size depends on the sampling frequency of the data. We also determined that incorporating future operational features overall improves model performance. We conclude that better standards for data-driven petroleum forecasts are needed, especially in pre-processing and feature selection practices, which need further evaluation. ...
Abstract in Portuguese (Brasil)
Os Gêmeos Digitais (GDs), uma tecnologia de ponta na Indústria 4.0, encontram amplas aplicações no setor de Óleo e Gás (O&G), especialmente na gestão de desempenho de ativos. Ao replicar virtualmente um ativo físico, os GDs fornecem uma plataforma digital para explorar vários cenários e estratégias de resolução de problemas sem interromper os processos operacionais. A integração dos princípios dos GDs e técnicas de Aprendizado de Máquina (AM) oferece uma promessa importante para aprimorar as ca ...
Os Gêmeos Digitais (GDs), uma tecnologia de ponta na Indústria 4.0, encontram amplas aplicações no setor de Óleo e Gás (O&G), especialmente na gestão de desempenho de ativos. Ao replicar virtualmente um ativo físico, os GDs fornecem uma plataforma digital para explorar vários cenários e estratégias de resolução de problemas sem interromper os processos operacionais. A integração dos princípios dos GDs e técnicas de Aprendizado de Máquina (AM) oferece uma promessa importante para aprimorar as capacidades de previsão de produção na indústria de O&G, possibilitando uma tomada de decisão mais informada e uma gestão de produção mais eficiente. Métodos tradicionais de previsão de produção na indústria têm limitações, como dependência da experiência especializada, disponibilidade de dados e custos computacionais. A utilização de algoritmos de AM oferece uma alternativa promissora aos métodos complexos. Neste trabalho, propomos um componente Prova de Conceito (POC) para GDs capaz de treinar modelos de AM para previsão de petróleo, executá-los em cenários hipotéticos e apresentar os resultados ao usuário final. Também reunimos resultados e insights de uma estratégia de seleção de modelo executada por esse componente de GD. Esta estratégia investigou o impacto no desempenho do modelo de: (1) diferentes tamanhos de janelas amostrais de treinamento, (2) uso de variáveis operacionais futuras e (3) escolha de diferentes frequências de amostragem de dados. A arquitetura proposta atendeu aos requisitos das partes interessadas e serve como um componente de gêmeo digital adequado para o setor de upstream. Os resultados da estratégia de comparação de modelos mostraram que o modelo de árvore ensemble XGBoost apresentou melhor desempenho do que as técnicas de aprendizado profundo para este conjunto de dados específico. Verificamos que o tamanho ideal da janela amostral depende da frequência de amostragem dos dados. Também determinamos que a incorporação de características operacionais futuras melhora o desempenho do modelo. Concluímos que são necessários melhores padrões para previsões de petróleo baseadas em dados, especialmente quanto as práticas de pré-processamento e seleção de features, que necessitam de uma avaliação mais aprofundada. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.
Collections
-
Exact and Earth Sciences (5129)Computation (1764)
This item is licensed under a Creative Commons License