Mostrar registro simples

dc.contributor.advisorRecamonde-Mendoza, Marianapt_BR
dc.contributor.authorMelo, Lucas Lima dept_BR
dc.date.accessioned2024-03-22T05:06:40Zpt_BR
dc.date.issued2024pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/274066pt_BR
dc.description.abstractRecently, a few works have started proposing the use of graph neural networks (GNNs) to embed knowledge of gene interactions in machine learning models and thus produce more robust classifiers for genomic classification tasks. GNNs, however, produce em beddings for each gene in the biological network, and these embeddings must then be summarized into a single representation that can be used to produce a classification for the entire network - a process commonly referred to as pooling. Although previous works have achieved encouraging results, there is a lack of studies that aim to understand the effects of the choice of GNN architecture, biological network, and, in particular, the pool ing approach. Therefore, this work aims to explore the impact that these alternatives have on the performance and interpretability of the resulting models. Our findings highlight SAGPool’s superior predictive power and GraphSAGE’s robustness across most pooling methods. We also showed that a preprocessing technique could offer enhanced perfor mance for certain pooling methods, providing favorable trade-offs in predictive perfor mance and computational resources. Despite challenges in identifying biomarker genes through saliency maps, we were able to identify genes like ADAM33 and DNASE1L3 that correlate with breast cancer. We conclude that the choice of the right architecture significantly impacts model performance and resource utilization, underscoring its im portance in GNNs studies.en
dc.description.abstractRecentemente, alguns trabalhos começaram a propor o uso de redes neurais de grafo (GNNs) para incorporar o conhecimento das interações genéticas nos modelos de aprendizado de máquina e, assim, produzir classificadores mais robustos para tarefas de classificação genômica. No entanto, as GNNs produzem embeddings para cada gene na rede biológica, e esses embeddings devem então ser resumidas em uma única representação que possa ser usada para produzir uma classificação para toda a rede - um processo comumente referido como pooling. Embora trabalhos anteriores tenham alcançado resultados encorajadores, há uma falta de estudos que visem entender os efeitos da escolha da arquitetura da GNN, da rede biológica e, em particular, da abordagem de pooling. Portanto, este trabalho tem como objetivo explorar o impacto que essas alternativas têm no desempenho e na interpretabilidade dos modelos resultantes. Nossos resultados destacam o poder preditivo superior do SAGPool e a robustez do GraphSAGE em relação à maioria dos métodos de pooling. Também demonstramos que uma técnica de pré-processamento pode oferecer um melhor desempenho para certos métodos de pooling, proporcionando compensações favoráveis em poder preditivo e recursos computacionais. Apesar dos de safios em identificar genes marcadores através de mapas de saliência, fomos capazes de identificar genes como ADAM33 e DNASE1L3 que se correlacionam com o câncer de mama. Concluímos que a escolha da arquitetura correta impacta significativamente o de sempenho do modelo e a utilização de recursos, destacando sua importância em estudos de GNNs.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoengpt_BR
dc.rightsOpen Accessen
dc.subjectRedes neurais de grafopt_BR
dc.subjectGraph neural networksen
dc.subjectAprendizado de máquinapt_BR
dc.subjectPoolingen
dc.subjectInterpretabilityen
dc.subjectGenomapt_BR
dc.subjectGenomicsen
dc.titleA study on graph neural networks for classification tasks and model interpretability on genomic datasetspt_BR
dc.title.alternativeUm estudo sobre redes neurais em grafos para tarefas de classificação e interpretabilidade de modelos em conjuntos de dados genômicos pt
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coFontanari, Thomas Vaitsespt_BR
dc.identifier.nrb001197948pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2024pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples