Classificação com inferência para dados de alta dimensão
Fecha
2022Autor
Tutor
Co-director
Nivel académico
Maestría
Tipo
Materia
Resumo
Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de ream ...
Neste trabalho propomos um método de classificação com inferência para dois ou mais grupos no contexto de alta dimensionalidade e baixo tamanho amostral. Nesse contexto, o método de classificação proposto é comparado com uma metodologia recentemente proposta, através de simulações e aplicação a dados reais. Além disso, um teste de hipóteses é proposto e as propriedades assintóticas da estatística de teste são obtidas, no entanto a estimação da variância se dá a partir de um procedimento de reamostragem. Resultados das simulações mostram que o classificador é competitivo com a metodologia existente e a possibilidade de identificar se a classificação em um determinado grupo é estatisticamente significativa possibilita controlar o erro do tipo I, mostrando-se uma importante ferramenta em problemas de classificação. ...
Abstract
In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the class ...
In this work we propose a classification method with inference for two or more groups in the high dimensional low sample size context. The classification method is compared with a recently proposed methodology, through simulations and application to a real dataset. Furthermore, a hypothesis test is proposed and the asymptotic properties of the test statistics are obtained, however the estimation of the variance is given from a procedure resampling process. Simulation results show that the classifier is competitive with the existing methodology and the possibility of identifying whether the classification in a certain group is statistically significant makes it possible to control the type I error, proving to be an important tool in classification problems. ...
Institución
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Programa de Pós-Graduação em Estatística.
Colecciones
-
Ciencias Exactas y Naturales (5141)Estadística (27)
Este ítem está licenciado en la Creative Commons License