People Analytics : previsão de desligamentos por meio das técnicas de regressão logística e análise de sobrevivência
Visualizar/abrir
Data
2023Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição ...
O mercado de trabalho se tornou mais competitivo e globalizado nos últimos anos, acarretando altos indíces de rotatividade para as empresas. Com isso, surge uma necessidade cada vez maior de alocar ações de retenção de forma mais assertiva, identificando os colaboradores com maior risco de pedir desligamento e atuando em relação a eles, evitando assim impactos financeiros e de performance, e investindo tempo e dinheiro de forma mais estratégica. A técnica mais amplamente utilizada para predição de desligamentos voluntários é a Regressão Logística. Um modelo pouco conhecido na área, mas que é cada vez mais utilizado em problemas similares é a Análise de Sobrevivência. Sendo assim, este trabalho propõe tanto a utilização do modelo mais tradicional, quanto a introdução do modelo de sobrevivência. Visto que cada modelo prediz um aspecto diferente em relação ao desligamento do colaborador, probabilidade e tempo, respectivamente, o objetivo é cruzar as variáveis resposta dos dois modelos a fim de se desenvolver uma ferramenta de visualização de dados que forneça aos tomadores de decisão a possibilidade de alocar seus investimentos nos indivíduos com maior risco de desligamento, e que são, portanto, de alta prioridade em ações de retenção. Os modelos foram desenvolvidos com uma base de dados do período de Janeiro de 2021 e formada por 534 colaboradores. Os modelos foram analisados com base em três medidas de desempenho: percentual de acerto, teste KS e área abaixo da curva ROC, sendo a primeira medida apenas para o modelo logístico. Neste estudo, ambas as técnicas obtiveram desempenhos satisfatórios e demonstraram boa capacidade de predição. A ferramenta de visualização de dados desenvolvida propôs a divisão dos colaboradores em 3 níveis diferentes de priorização, cruzando os riscos de perda sob os aspectos probabilidade e tempo. ...
Abstract
The job market has become more competitive and globalized in recent years, leading to high turnover rates for companies. As a result, there is an increasing need to allocate retention actions more assertively, identifying employees with a higher risk of leaving and acting on them, thus avoiding financial and performance impacts and investing time and money more strategically. The most widely used technique for predicting voluntary turnover is Logistic Regression. A less well-known model in the ...
The job market has become more competitive and globalized in recent years, leading to high turnover rates for companies. As a result, there is an increasing need to allocate retention actions more assertively, identifying employees with a higher risk of leaving and acting on them, thus avoiding financial and performance impacts and investing time and money more strategically. The most widely used technique for predicting voluntary turnover is Logistic Regression. A less well-known model in the field but increasingly used in similar problems is Survival Analysis. Therefore, this work proposes both the use of the traditional model and the introduction of the survival model. Since each model predicts a different aspect of employee turnover, probability and time, respectively, the goal is to cross the response variables of both models to develop a data visualization tool that provides decision-makers with the ability to allocate their investments in individuals with the highest risk of turnover, and who are therefore a high priority for retention actions. The models were developed using a database from January 2021 and consisting of 534 employees. The models were evaluated based on three performance measures: accuracy rate, KS test, and area under the ROC curve, with the first measure only for the logistic model. In this study, both techniques achieved satisfactory performance and demonstrated good predictive ability. The data visualization tool developed proposed dividing employees into three different prioritization levels, crossing the risks of loss under the probability and time aspects. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Curso de Estatística: Bacharelado.
Coleções
-
TCC Estatística (295)
Este item está licenciado na Creative Commons License