Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos
dc.contributor.advisor | Recamonde-Mendoza, Mariana | pt_BR |
dc.contributor.author | Fabiano, Emanoel Aurelio Vianna | pt_BR |
dc.date.accessioned | 2023-07-05T03:47:37Z | pt_BR |
dc.date.issued | 2023 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/261776 | pt_BR |
dc.description.abstract | MicroRNAs (miRNAs) são pequenos RNAs não codificantes que desempenham um papel fundamental na regulação da expressão gênica através da ligação com RNAs mensageiros (mRNAs) alvos. Estudos recentes mostram que os miRNAs estão envolvidos na regulação de mecanismos fisiológicos e de processos patológicos associados a doenças como câncer, sendo portanto importante identificar interações miRNA–alvo. Devido ao grande número de mRNAs alvos que podem existir para um único miRNA, as análises experimentais são bastante demoradas e dispendiosas. Assim, a predição computacional de alvos de miRNAs usando métodos de aprendizado de máquina (AM) tornou-se uma alternativa bastante interessante. Contudo, esta abordagem ainda apresenta limitações, como a complexidade em desenvolver os modelos com dados desbalanceados em razão do pouco número de exemplos negativos disponíveis, assim como o grande número de resultados falsos positivos. Em face destes desafios, este trabalho tem como objetivo desenvolver um modelo baseado em redes neurais de grafos para inferir padrões de interações miRNAs– alvos a partir de grafos heterogêneos, integrando dados de expressão gênica em câncer para introduzir o contexto de alterações moleculares presentes na doença. Exploramos o algoritmo HinSAGE, o qual é uma adaptação do algoritmo GraphSAGE para grafos hete rogêneos disponibilizado pela biblioteca StellarGraph, com um grafo contendo interações miRNA–mRNA e mRNA–mRNA obtidas da base de dados RNAInter, e dados de ex pressão diferencial para 15 tipos de câncer obtidos do projeto The Cancer Genome Atlas (TCGA). Nossos resultados indicam que o algoritmo HinSAGE foi capaz de aprender padrões de interações miRNA–alvo a partir da própria estrutura do grafo e dos atributos dos nós, apresentando precisão média de 77%, sensibilidade de 80%, F1-score de 78% e ROC AUC de 86% nos dados de teste. Nosso modelo também mostrou-se competitivo em relação a abordagens relacionadas, destacando-se com acurácia e F1-score sempre próxi mos aos 90% para interações de teste comuns. Por fim, o aprendizado baseado em grafo apresentou resultados superiores a um modelo treinado com uma rede neural tradicional utilizando somente os padrões de expressão gênica. Assim, acredita-se que o uso de redes neurais de grafos se estabelece como um novo horizonte de estudo na descoberta de inte rações miRNAs–alvos, possibilitando poder preditivo alto e balanceado, e a amostragem de interações negativas a partir do grafo base. | pt_BR |
dc.description.abstract | MicroRNAs (miRNAs) are small non-coding RNAs that are crucial in regulating gene expression by binding to messenger RNAs (mRNAs) targets. Recent studies show that miRNAs regulate physiological mechanisms and pathological processes associated with diseases such as cancer. Therefore, it is essential to identify miRNA-target interactions. Due to the large number of target mRNAs that can exist for a single miRNA, experimen tal analyzes are pretty time-consuming and expensive. Thus, computational prediction of miRNA targets using machine learning (ML) methods has become an exciting alternative. However, this approach still has limitations, such as the complexity of developing models with imbalanced data due to the small number of negative examples available and many false positive results. Motivated by these challenges, this work aims to develop a model based on graph neural networks (GNNs) to infer patterns of miRNA-target interactions from heterogeneous graphs, integrating cancer gene expression data to introduce the con text of molecular alterations present in the disease We explored the HinSAGE algorithm, which is an adaptation of the GraphSAGE algorithm for heterogeneous graphs provided by the StellarGraph library, with a graph containing miRNA–mRNA and mRNA–mRNA interactions obtained from the RNAInter database, and differential expression data for 15 cancer types from the The Cancer Genome Atlas (TCGA) project. Our results indi cate that the HinSAGE algorithm was able to learn patterns of miRNA-target interactions from the graph structure itself and the node attributes, with an average precision of 77%, sensitivity of 80%, F1-score of 78 %, and ROC AUC of 86% on test data. Our model also proved competitive concerning related approaches, standing out with accuracy and F1-score close to 90% for common test interactions. Finally, graph-based learning pre sented better results than a model trained with a traditional neural network using only gene expression patterns. Thus, we believe that the use of GNNs establishes itself as a new horizon of study in the discovery of miRNA-target interactions, allowing high and balanced predictive power, and the sampling of interactions negatives from the base graph. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | eng | pt_BR |
dc.rights | Open Access | en |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | MiRNA target prediction | en |
dc.subject | Redes neurais | pt_BR |
dc.subject | GraphSAGE | en |
dc.subject | Grafos | pt_BR |
dc.title | Explorando redes neurais de grafos para predição de interações miRNA–alvo associadas a câncer em grafos heterogêneos | pt_BR |
dc.title.alternative | Exploring graph neural networks to predict cancer-associated miRNA-target interactions in heterogeneous graphs | pt |
dc.type | Dissertação | pt_BR |
dc.identifier.nrb | 001172470 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Informática | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2023 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Este item está licenciado na Creative Commons License
-
Ciências Exatas e da Terra (5129)Computação (1764)