Abordagens de seleção de variáveis para classificação e regressão em dados espectrais para controle da qualidade

Fontes, Juliana de Abreu

dc.contributor.advisor	Anzanello, Michel José	pt_BR
dc.contributor.author	Fontes, Juliana de Abreu	pt_BR
dc.date.accessioned	2020-07-02T03:36:09Z	pt_BR
dc.date.issued	2020	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/211247	pt_BR
dc.description.abstract	Técnicas espectroscópicas têm sido amplamente empregadas na resolução de problemas referentes à verificação de autenticidade e padrões de qualidade de produtos. No entanto, tais técnicas tendem a gerar um elevado número de variáveis (comprimentos de onda – COs) ruidosas e altamente correlacionadas, reforçando a importância do uso de técnicas que permitam remover as variáveis não informativas e garantir a construção de modelos consistentes de classificação e predição, diminuindo tanto o risco de inferências como o custo computacional. Esta dissertação propõe sistemáticas para seleção de COs com vistas à classificação de produtos e predição de propriedades químicas.Os métodos aqui propostos mesclam diferentes técnicas de aprendizado de máquina para definir os subconjuntos de variáveis mais importantes para as predições. Para tanto, inicialmente faz-se uma investigação sobre métodos de seleção de variáveis por meio de uma pesquisa bibliográfica. Em seguida, visando predizer propriedades químicas das amostras de misturas de combustível, faz-se uso de conceitos químicos advindos da Lei de Lambert-Beer para a geração de índices de importância de variáveis; subconjuntos de variáveis são então construídos por meio de uma abordagem direta com redes neurais artificiais (Artificial Neural Networks– ANN). Por fim, utiliza-se o método estatístico qui-quadrado (𝜒2) combinado com a ferramenta de classificação floresta aleatória (Random Forest– RF) para selecionar o subconjunto de COs que resulte na maior acurácia média com vistas à classificação de amostras de alimentos e drogas (lícitas e ilícitas) em autênticas ou não-autênticas, segundo sua identidade e/ou origem.A aplicação dos métodos propostosem bancos reais possibilitou predições mais robustas, bem como redução do número de variáveis retidas nos modelos.	pt_BR
dc.description.abstract	Spectroscopic techniques have been widely used in solving problems related to authenticity verification and product quality standards. However, the result of these techniques tends to generate a high number of variables (wavelengths) noisy and highly correlated, reinforcing the importance of using techniques that allow removing non-informative variables and ensure the construction of consistent classification and prediction models, reducing both the risk of inferences and computational cost. This dissertation purposes systematics for the selection wavelengths in order to classify products and predict chemical properties. The methods proposed here merge different machine learning techniques to define the subsets of wavelengths most important to predictions. Therefore, an investigation is initially carried out on methods of variable selection through a bibliographic research. Then, in order to predict chemical properties of fuel mixture samples, chemical concepts from the Lambert-Beer law are used for the generation of variable importance indexes; subsets of variables are then constructed through a direct approach with artificial neural networks (ANN). Finally, the chi-square statistical method (𝜒2)combined with the random forest classification tool (RF) is used to select the subset of wavelengths that results in greater average accuracy aiming to classify food and drug samples (lawful and illicit), in authentic or not authentic, according to their identity and/ or origin. The application of the methods proposed in real banks allowed the realization of more robust predictions, as well as the reduction of the number of variables retained in the models.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	por	pt_BR
dc.rights	Open Access	en
dc.subject	Product authenticity	en
dc.subject	Seleção de comprimentos de onda	pt_BR
dc.subject	Wavelength selection	en
dc.subject	Seleção de variáveis	pt_BR
dc.subject	Espectroscopia	pt_BR
dc.subject	Classification	en
dc.subject	Sistemas de produção	pt_BR
dc.subject	Regression	en
dc.subject	Spectroscopy	en
dc.title	Abordagens de seleção de variáveis para classificação e regressão em dados espectrais para controle da qualidade	pt_BR
dc.title.alternative	Feature selection approaches for classification and regression in spectral data for quality control	en
dc.type	Dissertação	pt_BR
dc.identifier.nrb	001115553	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Escola de Engenharia	pt_BR
dc.degree.program	Programa de Pós-Graduação em Engenharia de Produção e Transportes	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2020	pt_BR
dc.degree.level	mestrado	pt_BR

Nome:: 001115553.pdf
Tamanho:: 2.687Mb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Engenharias (7390)

Engenharia de Produção (1230)

Mostrar registro simples