Mostrar registro simples

dc.contributor.authorOlivera, André Rodriguespt_BR
dc.contributor.authorRoesler, Valterpt_BR
dc.contributor.authorIochpe, Ciranopt_BR
dc.contributor.authorSchmidt, Maria Inêspt_BR
dc.contributor.authorVigo, Álvaropt_BR
dc.contributor.authorBarreto, Sandhi Mariapt_BR
dc.contributor.authorDuncan, Bruce Bartholowpt_BR
dc.date.accessioned2017-09-05T02:32:30Zpt_BR
dc.date.issued2017pt_BR
dc.identifier.issn1516-3180pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/166128pt_BR
dc.description.abstractCONTEXT AND OBJECTIVE: Type 2 diabetes is a chronic disease associated with a wide range of serious health complications that have a major impact on overall health. The aims here were to develop and validate predictive models for detecting undiagnosed diabetes using data from the Longitudinal Study of Adult Health (ELSA-Brasil) and to compare the performance of different machine-learning algorithms in this task. DESIGN AND SETTING: Comparison of machine-learning algorithms to develop predictive models using data from ELSA-Brasil. METHODS: After selecting a subset of 27 candidate variables from the literature, models were built and validated in four sequential steps: (i) parameter tuning with tenfold cross-validation, repeated three times; (ii) automatic variable selection using forward selection, a wrapper strategy with four different machinelearning algorithms and tenfold cross-validation (repeated three times), to evaluate each subset of variables; (iii) error estimation of model parameters with tenfold cross-validation, repeated ten times; and (iv) generalization testing on an independent dataset. The models were created with the following machine-learning algorithms: logistic regression, artificial neural network, naïve Bayes, K-nearest neighbor and random forest. RESULTS: The best models were created using artificial neural networks and logistic regression. These achieved mean areas under the curve of, respectively, 75.24% and 74.98% in the error estimation step and 74.17% and 74.41% in the generalization testing step. CONCLUSION: Most of the predictive models produced similar results, and demonstrated the feasibility of identifying individuals with highest probability of having undiagnosed diabetes, through easily-obtained clinical data.en
dc.description.abstractCONTEXTO E OBJETIVO: Diabetes tipo 2 é uma doença crônica associada a graves complicações de saúde, causando grande impacto na saúde global. O objetivo foi desenvolver e validar modelos preditivos para detectar diabetes não diagnosticada utilizando dados do Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil) e comparar o desempenho de diferentes algoritmos de aprendizagem de máquina. TIPO DE ESTUDO E LOCAL: Comparação de algoritmos de aprendizagem de máquina para o desenvolvimento de modelos preditivos utilizando dados do ELSA-Brasil. MÉTODOS: Após selecionar 27 variáveis candidatas a partir da literatura, modelos foram construídos e validados em 4 etapas sequenciais: (i) afinação de parâmetros com validação cruzada (10-fold cross-validation); (ii) seleção automática de variáveis utilizando seleção progressiva, estratégia “wrapper” com quatro algoritmos de aprendizagem de máquina distintos e validação cruzada para avaliar cada subconjunto de variáveis; (iii) estimação de erros dos parâmetros dos modelos com validação cruzada; e (iv) teste de generalização em um conjunto de dados independente. Os modelos foram criados com os seguintes algoritmos de aprendizagem de máquina: regressão logística, redes neurais artificiais, naïve Bayes, K vizinhos mais próximos e floresta aleatória. RESULTADOS: Os melhores modelos foram criados utilizando redes neurais artificiais e regressão logística alcançando, respectivamente, 75,24% e 74,98% de média de área sob a curva na etapa de estimação de erros e 74,17% e 74,41% na etapa de teste de generalização. CONCLUSÃO: A maioria dos modelos preditivos produziu resultados semelhantes e demonstrou a viabilidade de identificar aqueles com maior probabilidade de ter diabetes não diagnosticada com dados clínicos facilmente obtidos.pt_BR
dc.format.mimetypeapplication/pdf
dc.language.isoengpt_BR
dc.relation.ispartofSão Paulo medical journal. São Paulo. Vol. 135, n. 3 (2017), p. 234-246pt_BR
dc.rightsOpen Accessen
dc.subjectAprendizado de máquina supervisionadopt_BR
dc.subjectSupervised machine learningen
dc.subjectDecision support techniquesen
dc.subjectDiabetes mellitus tipo 2pt_BR
dc.subjectData miningen
dc.subjectModelos estatísticospt_BR
dc.subjectMineração de dadospt_BR
dc.subjectModels, statisticalen
dc.subjectTécnicas de apoio para a decisãopt_BR
dc.subjectDeabetes mellitus, type 2en
dc.titleComparison of machine-learning algorithms to build a predictive model for detecting undiagnosed diabetes - ELSA-Brasil : accuracy studypt_BR
dc.title.alternativeComparação de algoritmos de aprendizagem de máquina para construir um modelo preditivo para detecção de diabetes não diagnosticada - ELSA-Brasil : estudo de acuráciapt_BR
dc.typeArtigo de periódicopt_BR
dc.identifier.nrb001045507pt_BR
dc.type.originNacionalpt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples