Uso de informação secundária imprecisa como distribuição de probabilidade local em conjuntos de dados completamente heterotópicos
View/ Open
Date
2019Author
Advisor
Co-advisor
Academic level
Doctorate
Type
Abstract in Portuguese
Decisões na indústria mineral são geralmente baseadas em modelos estimados/simulados obtidos a partir de amostras. Durante a fase de exploração, as amostras são extraídas por furos de sondagem diamantados (DDH), que tendem a ser precisas e acuradas, mas são de alto custo e, consequentemente, escassas. Essas amostras são consideradas "hard data ou variável primária". Na fase de produção, as amostras podem ser coletadas por pó de perfuratriz ou amostras de fragmentos de rocha. Essas amostras são ...
Decisões na indústria mineral são geralmente baseadas em modelos estimados/simulados obtidos a partir de amostras. Durante a fase de exploração, as amostras são extraídas por furos de sondagem diamantados (DDH), que tendem a ser precisas e acuradas, mas são de alto custo e, consequentemente, escassas. Essas amostras são consideradas "hard data ou variável primária". Na fase de produção, as amostras podem ser coletadas por pó de perfuratriz ou amostras de fragmentos de rocha. Essas amostras são de baixo custo, abundantes e com alta incerteza. Portanto, tendem a existir mais dados com má qualidade, se comparado aos dados da fase de exploração. Essas amostras são consideradas “soft data ou variável secundária”. Abordagens clássicas em geoestatística, para integrar as variáveis primárias e secundárias, utilizam os algoritmos de cokrigagem e co-simulação, que requerem o modelo linear de coregionalização. A obtenção desse modelo pode ser considerado uma tarefa difícil quando existem duas ou mais variáveis secundárias disponíveis. Este trabalho propôs uma metodologia que, inicialmente, transforma os dados da variável secundária em variável primária a partir da construção distribuição probabilidade local a priori, incorporando a incerteza das medidas nas amostras, e em seguida executa o algorimo de simulação estocástica. Para dados que podem ter diferentes suporte, foi investigado o algoritmo de simulação sequencial direta com distribuições pontuais. Foram comparadas três metodologias: Metodologia 01: Simulação sequencial direta utilizando somente a variável primária, Metodologia 02: Simulação sequencial direta com distribuição pontual utilizando krigagem simples e na Metodologia 03: Simulação sequencial direta com distribuições pontuais utilizando cokrigagem simples com modelo intrínseco para inferir os pseudohards. Os resultados mostraram que quando os pseudohards são inferidos com o algoritmo de cokrigagem, e a correlação entre os dados é considerada, melhora a reprodução da distribuição local e os modelos são mais precisos e acurados . Para dados com mesmo suporte, tantos primários como secundários, foram avaliadas quatro metodologias definidas como: Metodologia 01: Simulação estocástica utilizando apenas a variável primária, Metodologia 02: Simulação estocástica utilizando a variável primária e secundária como distribuição bivariada normal, Metodologia 03: Simulação estocástica utilizando a variável primária e secundária como distribuição inferida por cokrigagem e Metodologia 04: Simulação estocástica utilizando inserção múltipla com atualização bayesiana no local da secundária. Verificou-se que a amostragem da distribuição de probabilidade pelo algoritmo de Monte Carlo (MCS), tem-se a reprodução da continuidade espacial dos pseudohards inferidos com flutuações ergódicas menores que o algoritmo de simulação por campos de probabilidade (p-field). Sobre a construção da distribuição, verificou-se que a distribuição local quando foram utilizados os dados da variável secundária no local e na vizinhança e a variável primária, os modelos finais foram mais precisos e acurados. Além disto, esta abordagem pode ser utilizada com qualquer algoritmo de simulação estocástica. As abordagens propostas apresentam duas vantagens: i) os erros da variável secundária são mitigados e não são transferidos para o modelo final ii) para incorporar a variável secundária é necessário somente o modelo de continuidade espacial da variável primária, evitando a modelagem do modelo linear de coregionalização (MLC). As metodologias propostas foram ilustradas em um banco de dados real, em 3D, em uma mina subterrânea de cobre e zinco, em que a variável primária e secundária possuem heterotopia total. Verificou-se, nas metodologias investigadas, que a informação secundária foi incorporada sem que o viés e a imprecisão fossem transferidos para os modelos. As metodologias produzem modelos mais precisos e acurados quando comparados aos gerados usando somente dados primários. ...
Abstract
Decisions in the mining industry are generally based on estimated/simulated models obtained from samples. During the exploration stage, samples obtained by diamond drilling holes (DDH) tend to be precise and accurate, but are expensive and, consequently, sparse. These samples are considered "hard data" or "primary variable". In the production stage, the samples are collected by reverse circulation or chip samples. These samples are cheaper, abundant and higher uncertainty than DDH. These sample ...
Decisions in the mining industry are generally based on estimated/simulated models obtained from samples. During the exploration stage, samples obtained by diamond drilling holes (DDH) tend to be precise and accurate, but are expensive and, consequently, sparse. These samples are considered "hard data" or "primary variable". In the production stage, the samples are collected by reverse circulation or chip samples. These samples are cheaper, abundant and higher uncertainty than DDH. These samples are considered "soft data". Thus, there is a tendency to collect data in the production stage, instead of in the exploration stage, as the quantity of samples overcome its low. Classical approaches in geostatistics, to integrate primary and secondary variables, suggests that the use of cokriging and co-simulation algorithms requires a linear model of coregionalization (LMC). It can be considered a difficult task to obtained this model when two or more secondary variables are available. This study proposes a methodology that initially transforms the secondary variable into primary variable from local probability distribution by incorporating the uncertainty of the measurements in the samples. This approach is used to perform the stochastic simulation algorithm. To integrate data with different support, Direct sequential simulation with local distributions algorithm was investigated. Three methodologies was compared: Methodology 01: Direct sequential simulation using only the primary variable; Methodology 02: Direct sequential simulation with local distribution using simple kriging; Methodology 03: Direct sequential simulation with local distributions using simple cokriging with intrinsic model to infer pseudohards. The results showed that the pseudohards were inferred with the cokriging algorithm and the correlation between variables was considered. It improves the reproduction of the local distribution and the final models are more precise and accurate. To incorporate primary and secondary variables with the same support, four methodologies was evaluated: Methodology 01:Stochastic simulation using only the primary variable; Methodology 02:Stochastic simulation using the primary and secondary variable as normal bivariate distribution; Methodology 03:Stochastic simulation using the primary and secondary variables as a distribution inferred by cokriging with intrinsic model; Methodology 04:Stochastic simulation using multiple imputation with Bayesian update at secondary variable location. The results showed that the spatial continuity reproduction of the pseudohards has less ergodic fluctuations in the probability distribution sampling by the Monte Carlo algorithm (MCS) than the sampling by p-field simulation algorithm. To build the distribution, the local distribution was verified when both secondary and primary variables were used. The secondary variable considered locally and in the neighborhood. The final models were more precise and accurate. In addition, this approach can be used with any stochastic simulation algorithm. The proposed approaches have two main advantages: i) the errors of the secondary variable are mitigated and are not transferred to the final model; ii) to incorporate the secondary variable it is necessary only the spatial continuity model of the primary variable, avoiding the modeling of the LMC. The developed methodologies were applied in a real case study, copper and zinc underground mine, where the primary and secondary variables are completely heterotopic. It was verified that bias and imprecision of the secondary data were not transferred to the final models. The methodologies produce more precise and accurate models when compared to models obtained using only primary data. ...
Institution
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Programa de Pós-Graduação em Engenharia de Minas, Metalúrgica e de Materiais.
Collections
-
Engineering (7425)
This item is licensed under a Creative Commons License