Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos

Fabiano, Emanoel Aurelio Vianna

dc.contributor.advisor	Recamonde-Mendoza, Mariana	pt_BR
dc.contributor.author	Fabiano, Emanoel Aurelio Vianna	pt_BR
dc.date.accessioned	2023-07-05T03:47:37Z	pt_BR
dc.date.issued	2023	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/261776	pt_BR
dc.description.abstract	MicroRNAs (miRNAs) são pequenos RNAs não codificantes que desempenham um papel fundamental na regulação da expressão gênica através da ligação com RNAs mensageiros (mRNAs) alvos. Estudos recentes mostram que os miRNAs estão envolvidos na regulação de mecanismos fisiológicos e de processos patológicos associados a doenças como câncer, sendo portanto importante identificar interações miRNA–alvo. Devido ao grande número de mRNAs alvos que podem existir para um único miRNA, as análises experimentais são bastante demoradas e dispendiosas. Assim, a predição computacional de alvos de miRNAs usando métodos de aprendizado de máquina (AM) tornou-se uma alternativa bastante interessante. Contudo, esta abordagem ainda apresenta limitações, como a complexidade em desenvolver os modelos com dados desbalanceados em razão do pouco número de exemplos negativos disponíveis, assim como o grande número de resultados falsos positivos. Em face destes desafios, este trabalho tem como objetivo desenvolver um modelo baseado em redes neurais de grafos para inferir padrões de interações miRNAs– alvos a partir de grafos heterogêneos, integrando dados de expressão gênica em câncer para introduzir o contexto de alterações moleculares presentes na doença. Exploramos o algoritmo HinSAGE, o qual é uma adaptação do algoritmo GraphSAGE para grafos hete rogêneos disponibilizado pela biblioteca StellarGraph, com um grafo contendo interações miRNA–mRNA e mRNA–mRNA obtidas da base de dados RNAInter, e dados de ex pressão diferencial para 15 tipos de câncer obtidos do projeto The Cancer Genome Atlas (TCGA). Nossos resultados indicam que o algoritmo HinSAGE foi capaz de aprender padrões de interações miRNA–alvo a partir da própria estrutura do grafo e dos atributos dos nós, apresentando precisão média de 77%, sensibilidade de 80%, F1-score de 78% e ROC AUC de 86% nos dados de teste. Nosso modelo também mostrou-se competitivo em relação a abordagens relacionadas, destacando-se com acurácia e F1-score sempre próxi mos aos 90% para interações de teste comuns. Por fim, o aprendizado baseado em grafo apresentou resultados superiores a um modelo treinado com uma rede neural tradicional utilizando somente os padrões de expressão gênica. Assim, acredita-se que o uso de redes neurais de grafos se estabelece como um novo horizonte de estudo na descoberta de inte rações miRNAs–alvos, possibilitando poder preditivo alto e balanceado, e a amostragem de interações negativas a partir do grafo base.	pt_BR
dc.description.abstract	MicroRNAs (miRNAs) are small non-coding RNAs that are crucial in regulating gene expression by binding to messenger RNAs (mRNAs) targets. Recent studies show that miRNAs regulate physiological mechanisms and pathological processes associated with diseases such as cancer. Therefore, it is essential to identify miRNA-target interactions. Due to the large number of target mRNAs that can exist for a single miRNA, experimen tal analyzes are pretty time-consuming and expensive. Thus, computational prediction of miRNA targets using machine learning (ML) methods has become an exciting alternative. However, this approach still has limitations, such as the complexity of developing models with imbalanced data due to the small number of negative examples available and many false positive results. Motivated by these challenges, this work aims to develop a model based on graph neural networks (GNNs) to infer patterns of miRNA-target interactions from heterogeneous graphs, integrating cancer gene expression data to introduce the con text of molecular alterations present in the disease We explored the HinSAGE algorithm, which is an adaptation of the GraphSAGE algorithm for heterogeneous graphs provided by the StellarGraph library, with a graph containing miRNA–mRNA and mRNA–mRNA interactions obtained from the RNAInter database, and differential expression data for 15 cancer types from the The Cancer Genome Atlas (TCGA) project. Our results indi cate that the HinSAGE algorithm was able to learn patterns of miRNA-target interactions from the graph structure itself and the node attributes, with an average precision of 77%, sensitivity of 80%, F1-score of 78 %, and ROC AUC of 86% on test data. Our model also proved competitive concerning related approaches, standing out with accuracy and F1-score close to 90% for common test interactions. Finally, graph-based learning pre sented better results than a model trained with a traditional neural network using only gene expression patterns. Thus, we believe that the use of GNNs establishes itself as a new horizon of study in the discovery of miRNA-target interactions, allowing high and balanced predictive power, and the sampling of interactions negatives from the base graph.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	MiRNA target prediction	en
dc.subject	Redes neurais	pt_BR
dc.subject	GraphSAGE	en
dc.subject	Grafos	pt_BR
dc.title	Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos	pt_BR
dc.title.alternative	Exploring graph neural networks to predict cancer-associated miRNA-target interactions in heterogeneous graphs	pt
dc.type	Dissertação	pt_BR
dc.identifier.nrb	001172470	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Computação	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2023	pt_BR
dc.degree.level	mestrado	pt_BR

Files in this item

Name:: 001172470.pdf
Size:: 2.455Mb
Format:: PDF
Description:: Texto completo

View/Open

This item is licensed under a Creative Commons License

Exact and Earth Sciences (5183)

Computation (1779)

Show simple item record