An approach for analyzing and classifying microarray data using gene co-expression networks cycles
Visualizar/abrir
Data
2017Orientador
Co-orientador
Nível acadêmico
Doutorado
Tipo
Outro título
Uma abordagem para analisar e classificar dados microarrays usando ciclos de redes de co-expressão gênica
Assunto
Abstract
One of the main research areas in Systems Biology concerns the discovery of biological networks from microarray datasets. These networks consist of a great number of genes whose expression levels affect each other in various ways. We present a new way of analyzing microarray datasets, based on the different kind of cycles found among genes of the co-expression networks constructed using quantized data obtained from the microarrays. The input of the analysis method is formed by raw data, a set o ...
One of the main research areas in Systems Biology concerns the discovery of biological networks from microarray datasets. These networks consist of a great number of genes whose expression levels affect each other in various ways. We present a new way of analyzing microarray datasets, based on the different kind of cycles found among genes of the co-expression networks constructed using quantized data obtained from the microarrays. The input of the analysis method is formed by raw data, a set of interest genes (for example, genes from a known pathway) and a function (activator or inhibitor) of these genes. The output of the method is a set of cycles. A cycle is a closed walk, in which all vertices (except the first and last) are distinct. Thanks to the new way of finding relations among genes, a more robust interpretation of gene correlations is possible, because cycles are associated with feedback mechanisms that are very common in biological networks. Our hypothesis is that negative feedbacks allow finding relations among genes that may help explaining the stability of the regulatory process within the cell. Positive feedback cycles, on the other hand, may show the amount of imbalance of a certain cell in a given time. The cycle-based analysis allows identifying the stoichiometric relationship between the genes of the network. This methodology provides a better understanding of the biology of tumors. As a consequence, it may enable the development of more effective treatment therapies. Furthermore, cycles help differentiate, measure and explain the phenomena identified in healthy and diseased tissues. Cycles may also be used as a new method for classification of samples of a microarray (cancer diagnosis). Compared to other classification methods, cycle-based classification provides a richer explanation of the proposed classification, that can give hints on the possible therapies. Therefore, the main contributions of this thesis are: (i) a new cycle-based analysis method; (ii) a new microarray samples classification method; (iii) and, finally, application and achievement of practical results. We use the proposed methodology to analyze the genes of four networks closely related with cancer - apoptosis, glucolysis, cell cycle and NF B - in tissues of the most aggressive type of brain tumor (Gliobastoma multiforme – GBM) and in healthy tissues. Because most patients with GBMs die in less than a year, and essentially no patient has long-term survival, these tumors have drawn significant attention. Our main results show that the stoichiometric relationship between genes involved in apoptosis, glucolysis, cell cycle and NF B pathways is unbalanced in GBM samples versus control samples. This dysregulation can be measured and explained by the identification of a higher percentage of positive cycles in these networks. This conclusion helps to understand more about the biology of this tumor type. The proposed cycle-based classification method achieved the same performance metrics as a neural network, a classical classification method. However, our method has a significant advantage with respect to neural networks. The proposed classification method not only classifies samples, providing diagnosis, but also explains why samples were classified in a certain way in terms of the feedback mechanisms that are present/absent. This way, the method provides hints to biochemists about possible laboratory experiments, as well as on potential drug target genes. ...
Resumo
Uma das principais áreas de pesquisa em Biologia de Sistemas refere-se à descoberta de redes biológicas a partir de conjuntos de dados de microarrays. Estas redes consistem de um grande número de genes cujos níveis de expressão afetam os outros genes de vários modos. Nesta tese, apresenta-se uma nova maneira de analisar os conjuntos de dados de microarrays, com base nos diferentes tipos de ciclos encontrados entre os genes das redes de co-expressão construídas com dados quantificados obtidos a ...
Uma das principais áreas de pesquisa em Biologia de Sistemas refere-se à descoberta de redes biológicas a partir de conjuntos de dados de microarrays. Estas redes consistem de um grande número de genes cujos níveis de expressão afetam os outros genes de vários modos. Nesta tese, apresenta-se uma nova maneira de analisar os conjuntos de dados de microarrays, com base nos diferentes tipos de ciclos encontrados entre os genes das redes de co-expressão construídas com dados quantificados obtidos a partir dos microarrays. A entrada do método de análise é formada pelos dados brutos, um conjunto de genes de interesse (por exemplo, genes de uma via conhecida) e uma função (ativador ou inibidor) destes genes. A saída do método é um conjunto de ciclos. Um ciclo é um caminho fechado com todos os vértices (exceto o primeiro e o último) distintos. Graças à nova forma de encontrar relações entre os genes, é possível uma interpretação mais robusta das correlações dos genes, porque os ciclos estão associados a mecanismos de feedback, que são muito comuns em redes biológicas. A hipótese é que feedbacks negativos permitem encontrar relações entre os genes que podem ajudar a explicar a estabilidade do processo regulatório dentro da célula. Ciclos de feedback positivo, por outro lado, podem mostrar a quantidade de desequilíbrio de uma determinada célula em um determinado momento. A análise baseada em ciclos permite identificar a relação estequiométrica entre os genes da rede. Esta metodologia proporciona uma melhor compreensão da biologia do tumor. Portanto, as principais contribuições desta tese são: (i) um novo método de análise baseada em ciclos; (ii) um novo método de classificação; (iii) e, finalmente, aplicação dos métodos e a obtenção de resultados práticos. A metodologia proposta foi utilizada para analisar os genes de quatro redes fortemente relacionadas com o câncer - apoptose, glicólise, ciclo celular e NF B - em tecidos do tipo mais agressivo de tumor cerebral (Gliobastoma multiforme - GBM) e em tecidos cerebrais saudáveis. A maioria dos pacientes com GBM morrem em menos de um ano, essencialmente nenhum paciente tem sobrevivência a longo prazo, por isso estes tumores têm atraído atenção significativa. Os principais resultados nesta tese mostram que a relação estequiométrica entre genes envolvidos na apoptose, glicólise, ciclo celular e NF B está desequilibrada em amostras de GBM em comparação as amostras de controle. Este desequilíbrio pode ser medido e explicado pela identificação de um percentual maior de ciclos positivos nas redes das primeiras amostras. Esta conclusão ajuda a entender mais sobre a biologia deste tipo de tumor. O método de classificação baseado no ciclo proposto obteve as mesmas métricas de desempenho como uma rede neural, um método clássico de classificação. No entanto, o método proposto tem uma vantagem significativa em relação às redes neurais. O método de classificação proposto não só classifica as amostras, fornecendo diagnóstico, mas também explica porque as amostras foram classificadas de uma certa maneira em termos dos mecanismos de feedback que estão presentes/ausentes. Desta forma, o método fornece dicas para bioquímicos sobre possíveis experiências laboratoriais, bem como sobre potenciais genes alvo de terapias. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Programa de Pós-Graduação em Computação.
Coleções
-
Ciências Exatas e da Terra (5143)Computação (1766)
Este item está licenciado na Creative Commons License