Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
Visualizar/abrir
Data
2020Orientador
Nível acadêmico
Mestrado
Tipo
Assunto
Resumo
O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográfic ...
O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográficas, de eventos estressantes da vida e variáveis clínicas. Para alcançar esse objetivo e abordar as limitações de trabalhos anteriores, utilizamos o National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). O NESARC é uma coorte publicamente disponível, mediante solicitação, com 43.093 participantes e com um período de seguimento de três anos. Ele foi realizado em duas ondas. Entrevistas presenciais foram realizadas com 43.093 indivíduos na Onda 1, com uma taxa de 81% de resposta. A onda 2 envolveu reavaliações presenciais com todos os participantes da onda 1, refletindo 34.653 entrevistas concluídas. As variáveis preditoras foram avaliadas na Onda 1, enquanto que o desfecho (participantes que tentaram suicídio versus participantes que não tentaram suicídio entre a Onda 1 e a Onda 2) foi avaliado na Onda 2. Nós utilizamos o elastic net regularization como nossa análise primária, mas também o random forest e o artificial neural networks. O modelo construído com o elastic net regularization distinguiu indivíduos que tentaram suicídio daqueles que não tentaram com uma área sob a curva ROC (AUC) de 0,89, acurácia balanceada de 81,86%, especificidade de 89,22% e sensibilidade de 74,51% para a população geral. Para os participantes com episódios depressivos maiores ao longo da vida, a AUC foi de 0,89, a acurácia balanceada de 81,64%, a especificidade de 85,86% e a sensibilidade de 77,42%. As variáveis mais importantes com o elastic net foram transtorno de personalidade borderline, transtorno de estresse pós-traumático e descendência asiática para o modelo com todos os participantes; e tentativa prévia de suicídio, transtorno de personalidade borderline e ter ficado uma noite no hospital por causa da depressão no modelo com indivíduos com episódios depressivos maiores ao longo da vida. Random forest e artificial neural networks tiveram desempenho semelhantes em comparação ao elastic net. Dessa forma, através desse trabalho, concluímos que o risco de tentativa de suicídio pode ser estimado com alta precisão, em nível individual, em uma amostra representativa da população americana, por meio da incorporação de variáveis sociodemográficas, de fatores estressantes da vida e de variáveis clínicas. Estudos futuros que integrem dados de diferentes níveis biológicos, como dados genéticos e de saúde digital, podem ajudar a construir modelos mais precisos. ...
Abstract
Suicide is a major cause of death worldwide and a tragic but highly preventable event. However, there is still little awareness of objective suicide risk stratification. The present dissertation aims to develop models to predict suicide attempts in the general population (Aim 1) and in participants with lifetime major depressive episodes (Aim 2) by using machine learning techniques coupled with sociodemographic, stressful life events, and clinical data. To achieve this and to address the limita ...
Suicide is a major cause of death worldwide and a tragic but highly preventable event. However, there is still little awareness of objective suicide risk stratification. The present dissertation aims to develop models to predict suicide attempts in the general population (Aim 1) and in participants with lifetime major depressive episodes (Aim 2) by using machine learning techniques coupled with sociodemographic, stressful life events, and clinical data. To achieve this and to address the limitations of prior works, we used the National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). NESARC is representative cohort publicly available by request with 43,093 participants a 3-year follow-up period. It was conducted in two waves. Face-to-face interviews were conducted with 43,093 respondents in Wave 1, yielding an overall response rate of 81%. Wave 2 of the NESARC involved face-to-face reinterviews with all Wave 1 participants, reflecting 34,653 completed interviews. Predictor variables were assessed in Wave 1, while the outcome (participants who attempted suicide versus participants who did not between Wave 1 and Wave 2) was assessed in Wave 2. We used elastic net regularization as our primary analysis, plus random forest, and artificial neural networks. The model built with elastic net regularization distinguished individuals who had attempted suicide from those who had not with an area under the ROC curve (AUC) of 0.89, balanced accuracy 81.86%, specificity 89.22%, and sensitivity 74.51% for the general population. For participants with lifetime major depressive episodes, AUC was 0.89, balanced accuracy 81.64%, specificity 85.86%, and sensitivity 77.42%. The most important variables for the model with elastic net were borderline personality disorder, posttraumatic stress disorder, and being of Asian descent for the model in all participants; and previous suicide attempt, borderline personality disorder, and stay overnight in hospital because of depression for the model in participants with lifetime major depressive episodes. Random forest and artificial neural networks had similar performance compared to elastic net. In conclusion, risk for suicide attempt can be estimated with high accuracy at an individual subject level by incorporating sociodemographic, stressful life events and clinical variables in a US national representative sample. Future studies integrating data from different biological levels, such as genetics and digital health data, could potentially help to build more accurate models. ...
Instituição
Universidade Federal do Rio Grande do Sul. Faculdade de Medicina. Programa de Pós-Graduação em Psiquiatria e Ciências do Comportamento.
Coleções
-
Ciências da Saúde (9085)Psiquiatria (439)
Este item está licenciado na Creative Commons License