Imputação múltipla utilizando o software SPSS
View/ Open
Date
2016Author
Advisor
Academic level
Graduation
Subject
Abstract in Portuguese (Brasil)
Introdução: Muitos dos métodos estatísticos existentes, como por exemplo modelos de regressão, exigem informações completas para que os resultados sejam produzidos. Porém, sabemos que na prática muitas vezes este pressuposto não é facilmente atendido. Como forma de tratamento aos dados faltantes temos a Imputação Múltipla (IM). Basicamente a técnica da IM consiste em criarmos cópias do banco de dados onde os dados faltantes são substituídos por diferentes valores imputados. O objetivo deste tra ...
Introdução: Muitos dos métodos estatísticos existentes, como por exemplo modelos de regressão, exigem informações completas para que os resultados sejam produzidos. Porém, sabemos que na prática muitas vezes este pressuposto não é facilmente atendido. Como forma de tratamento aos dados faltantes temos a Imputação Múltipla (IM). Basicamente a técnica da IM consiste em criarmos cópias do banco de dados onde os dados faltantes são substituídos por diferentes valores imputados. O objetivo deste trabalho será aplicar e descrever a técnica de Imputação Múltipla no software SPSS. Aplicação: Os dados utilizados se referem aos resultados obtidos em prova prática de candidatos a terem sua primeira habilitação para veículos de 4 rodas. Os dados originais não possuem valores faltantes, assim para proceder a IM no SPSS, perdas (5%, 10% e 20%) foram simuladas para uma variável preditora e para variável resposta correspondendo ao modelo de regressão utilizado. Para a qualificação das IM os bancos imputados foram analisados através de regressão logística e regressão de Poisson. Os resultados foram comparados entre os níveis de perda, e com os resultados obtidos para o banco completo. Resultados: Foi bastante satisfatório os resultados das regressões para os bancos com IM. As diferenças foram bem pequenas, então se realmente existisse a perda e a IM fosse necessária não teríamos grandes prejuízos nos resultados e suas respectivas interpretações. O software SPSS possui mais de um modelo de IM disponível e sua interface é bem intuitiva e amigável, o que facilita o uso da IM. ...
Abstract
Introduction: Several of the existing statistical methods, such as regression models, require complete information for the results to be produced. However, we know that in practice this assumption is often not easily accomplished. As a form of treatment to the missing data we have the Multiple Imputation (MI). Basically the MI technique consists on creating copies of the database where the missing data is replaced by different imputed values. The purpose of this paper will be to apply and descr ...
Introduction: Several of the existing statistical methods, such as regression models, require complete information for the results to be produced. However, we know that in practice this assumption is often not easily accomplished. As a form of treatment to the missing data we have the Multiple Imputation (MI). Basically the MI technique consists on creating copies of the database where the missing data is replaced by different imputed values. The purpose of this paper will be to apply and describe the Multiple Imputation technique in SPSS software. Application: The used data refers to the results obtained in a practical test of candidates to have their first driver’s license for four wheeled vehicles. The original data does not have missing values, so to proceed to MI in SPSS, losses (5%, 10% and 20%) were simulated for a predictive variable and for response variable corresponding to the regression model used. In order to qualify MI, the imputed banks were analyzed through logistic regression and Poisson regression. The results were compared between the loss levels, and with the results obtained for the complete bank. Results: We found the results of the regressions for banks with MI were quite satisfactory. The differences were very small, so if there was indeed a loss and MI was necessary we would not have much damage in the results and their respective interpretations. SPSS software has more than one MI model available and its interface is intuitive and user-friendly, making it easy to use MI. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Curso de Matemática: Licenciatura.
Collections
This item is licensed under a Creative Commons License