Gene expression analysis platform (GEAP) : uma plataforma flexível e intuitiva para análise de transcriptoma
View/ Open
Date
2018Author
Advisor
Co-advisor
Academic level
Graduation
Abstract in Portuguese (Brasil)
Atualmente, diversas técnicas em biologia molecular estão disponíveis com o propósito de auxiliar na observação de processos biológicos. Dentre essas técnicas, estão as análises de transcriptoma, que possibilitam quantificar a expressão de praticamente todos os genes em uma amostra sob uma determinada condição. Ao analisar transcriptomas, e possível explorar um grande volume de informações sobre fenômenos biológicos, inclusive de diversas doenças. Felizmente, muitos dados de transcriptoma estão ...
Atualmente, diversas técnicas em biologia molecular estão disponíveis com o propósito de auxiliar na observação de processos biológicos. Dentre essas técnicas, estão as análises de transcriptoma, que possibilitam quantificar a expressão de praticamente todos os genes em uma amostra sob uma determinada condição. Ao analisar transcriptomas, e possível explorar um grande volume de informações sobre fenômenos biológicos, inclusive de diversas doenças. Felizmente, muitos dados de transcriptoma estão disponíveis no banco de dados do Gene Expression Omnibus (GEO). Porém, analisar estes dados não é uma tarefa simples, sendo necessário um software especıfico para o Kit experimental utilizado na análise ou, alternativamente, conhecimento na linguagem de programação R. Os softwares de transcriptoma costumam suportar apenas arquivos do próprio fabricante, e podem não oferecer opções flexíveis para manipular seus dados. Por outro lado, aprender uma linguagem de programação não e trivial, e mesmo usuários com maior experiência podem ter dificuldades ao lidar com vários formatos de arquivos do GEO, considerando as milhares de plataformas presentes. Além disso, diminuir os requisitos de informática nesse tipo de análise pode acelerar a eficiência de obter seus resultados. Neste sentido, o programa Gene Expression Analysis Console (GEAP) foi desenvolvido com o propósito de analisar transcriptomas de forma visual e intuitiva, tendo maior foco em dados de microarranjo. Através do GEAP, o usuário pode: (i) baixar dados de séries e amostras do GEO sabendo apenas seu código de serie (Geo Series, ou GSE) ou de amostra (Geo Sample, ou GSM), sejam estes dados brutos ou previamente tratados; (ii) ler arquivos de transcriptoma pertencentes a milhares de plataformas atualmente disponíveis; (iii) permitir a criação de seu próprio conjunto de dados customizado, sendo uma ferramenta eficaz para lidar com formatos de arquivo de tabela; (iv) preparar e tratar estatisticamente os dados com algoritmos documentados pela literatura; (v) verificar a qualidade dos dados de forma visual e detalhada através de diagramas representativos; (vi) comparar a diferença de expressão entre as amostras e automatizar este processo seguindo metodologias bem consolidadas; (vii) visualizar os resultados de expressão diferencial por meio de tabelas otimizadas e diferentes tipos de gráficos que respondem a interação do usuário; e (viii) filtrar e organizar os resultados de forma personalizada, permitindo encontrar genes significantes. Por fim, este software foi desenvolvido tentando reunir os melhores atributos dos programas de microarranjo e da programação em R, com a finalidade de que qualquer usuário possa ter fácil acesso a analises de expressão genica por transcriptoma, ao mesmo tempo permitindo uma forte flexibilidade de manipulação dos dados, que até então era alcançada apenas com o R. ...
Abstract
Currently, a number of procedures in molecular biology are available in order to help the exploring of biological processes. Among these procedures, there is the transcriptome analysis, which allows to measure gene expression of virtually all genes contained in a set of samples under one specific condition. Through transcriptomic analyses, a large volume of information concerning several biological phenomena can be explored, including numerous diseases. Fortunately, many transcriptomic data are ...
Currently, a number of procedures in molecular biology are available in order to help the exploring of biological processes. Among these procedures, there is the transcriptome analysis, which allows to measure gene expression of virtually all genes contained in a set of samples under one specific condition. Through transcriptomic analyses, a large volume of information concerning several biological phenomena can be explored, including numerous diseases. Fortunately, many transcriptomic data are currently available in Gene Expression Omnibus (GEO) database. However, analyzing these data is not a trivial task, since it needs specific software for the experimental kit used in analysis, or alternatively, mastering the knowledge of R programming language. Usually, the transcriptome analysis softwares only support files from their own manufacturer, and also can lack flexible options for manipulating data. On the other side, it is not trivial to learn a programming language, and even experienced users can undergo hardship when dealing with the variety of file formats from GEO if we take into account the thousands of available platforms. Moreover, decreasing informatics requirements can bring more efficiency in getting results from the analyses. In this sense, a new software named Gene Expression Analysis Console (GEAP) was developed in order to analysise transcriptomes in a visual and intuitive manner, mainly focusing on microarray data. By using GEAP, the user can: (i) download series and samples from GEO by only knowing the GSE/GSM code, both for RAW data or values previously treated by the author; (ii) read transcriptomic files from thousands of available platforms; (iii) allow creating your own custom microarray data set, being as an effective tool for datasets formatted as tables; (iv) prepare the data and perform statistic treatment of expression values with well-documented algorithms from literature; (v) visually check the quality of your data with details through representative diagrams; (vi) compare the expression difference between samples and automate this process with at least six comparison methods, in addition to five options of statistic parameters for results correction; (vii) view the differentially expressed results in optimized tables and up to four dynamic charts that respond to user interaction; and (viii) filter and order results with customizable options, helping to find relevant genes. Lastly, this software was developed with as an attempt of putting together the best attributes from microarray programs and from R programming. Its aim is that any user could easily access transcriptome analysis, at the same time providing enough flexibility for data manipulation, which until now only has been reached with R. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Biociências. Curso de Biotecnologia.
Collections
This item is licensed under a Creative Commons License