Mostrar registro simples

dc.contributor.advisorRecamonde-Mendoza, Marianapt_BR
dc.contributor.authorSaccilotto, Pedro Durayskipt_BR
dc.date.accessioned2021-07-30T04:35:50Zpt_BR
dc.date.issued2021pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/224798pt_BR
dc.description.abstractAlterações do microbioma intestinal têm sido associadas a diversas condições de saúde em humanos. O presente trabalho teve como objetivo a aplicação de técnicas de aprendizado de máquina supervisionado para a construção de modelos preditivos, por meio da utilização de dados de fenótipos e microbiomas intestinais humanos. Utilizou-se como conjunto de dados as amostras publicadas pelo American Gut Project, as quais foram filtradas para a realização da predição de seis fenótipos: doença de refluxo gastroesofágico (GRDE), doença inflamatória intestinal, síndrome do intestino irritável, doenças autoimunes, doenças pulmonares e transtornos mentais. Como atributos foram utilizados os valores da tabela de abundância de Amplicon Sequence Variants das amostras obtidas, os quais foram tratados com PERFect, imputação de zero e transformação logarítmica. Aos modelos foram agrupados dados fenotípicos adicionais (e.g. idade, sexo e uso de probióticos). Os modelos foram treinados utilizando-se validação cruzada com 10 folds, técnicas de redução de desbalanceamento entre as classes e seleção de atributos embedded. Foi realizada uma comparação de diferentes modelos binários de classificação, como florestas aleatórias, regressão penalizada e gradient boosting. O modelo mais bem avaliado foi GRDE com regressão logística penalizada e valor de MCC 0,27. Foi confirmada a suposição de melhora na predição dos modelos com a inclusão de dados fenotípicos adicionais no conjunto de dados. Ainda que baixos valores de precisão tenham sido obtidos, impossibilitando a utilização dos modelos preditos na pesquisa clínica, considera-se, como perspectiva futura, que possa ser realizada análise dos atributos com maior contribuição e integração de novos dados para aperfeiçoar as predições dos modelos.pt_BR
dc.description.abstractChanges in the gut microbiome have been shown to be associated with several health conditions and other characteristics of the human host. The objective of the present work was to apply supervised machine learning techniques to build predictive models using human phenotypes and data from the gut microbiome. Samples published by the American Gut Project were used as dataset, which were filtered to predict six phenotypes: gastroesophageal reflux disease (GERD), inflammatory bowel disease, irritable bowel syndrome, autoimmune diseases, lung diseases and mental disorders. The values of the Amplicon Sequence Variants abundance table of the samples obtained treated with PERFect, imputation of zero and logarithmic transformation were used as features. Additional phenotype data (e.g. age, sex and use of probiotics) were added to the models. The models were trained using 10 fold cross validation, techniques to reduce imbalance between classes and embedded feature selection. A comparison of different binary classification models, such as random forests, penalized regression and gradient boosting was carried out. The best evaluated model was GERD with penalized logistic regression and a MCC value of 0.27. It was confirmed that the inclusion of additional phenotype data in the dataset improves the prediction of the models. Although low precision values have been obtained, making it impossible to use the models for clinical assistance, it is considered, as a future perspective, that the analysis of the attributes with greater contribution and further integration of new datasets can be performed to improve the predictions of the models.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectAprendizado : máquinapt_BR
dc.subjectMicrobiomeen
dc.subjectPredictive analytics in healthcareen
dc.titleDesenvolvimento de modelos de aprendizado de máquina para a detecção de fenótipos humanos com base em assinaturas de microbiomapt_BR
dc.title.alternativeDevelopment of machine learning models for detection of human phenotypes using microbiome signatures en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coVolpiano, Camila Gazollapt_BR
dc.identifier.nrb001127343pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2021pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Engenharia da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples