Desenvolvimento de pipeline para filogenômica de procariotos e genômica evolutiva de Mycoplasma spp.
Visualizar/abrir
Data
2022Autor
Orientador
Co-orientador
Nível acadêmico
Mestrado
Tipo
Resumo
Como resultado das novas tecnologias de sequenciamento, um grande número de espécies teve seus genomas completamente sequenciados e os dados gerados foram disponibilizados em bancos de dados públicos. Esses dados impulsionaram estudos evolutivos baseados em genômica comparativa usando ferramentas filogenéticas. Tais estudos computacionais fornecem subsídios para o entendimento de processos que moldaram os genomas das espécies e ajudam a inferir suas relações evolutivas. Bactérias do gênero Myco ...
Como resultado das novas tecnologias de sequenciamento, um grande número de espécies teve seus genomas completamente sequenciados e os dados gerados foram disponibilizados em bancos de dados públicos. Esses dados impulsionaram estudos evolutivos baseados em genômica comparativa usando ferramentas filogenéticas. Tais estudos computacionais fornecem subsídios para o entendimento de processos que moldaram os genomas das espécies e ajudam a inferir suas relações evolutivas. Bactérias do gênero Mycoplasma constituem um caso interessante para testar um pipeline de análise filogenômica, uma vez que possuem alguns dos menores genomas conhecidos dentre organismos capazes de realizar autorreplicação e que há um crescente número de novas espécies que estão sendo identificadas e tendo seus genomas sequenciados. Portanto, com o objetivo de automatizar o processo de análise filogenômica para a inferência e a reconstrução evolutiva de espécies, foi desenvolvido um pipeline denominado Pipelution e micoplasmas foram utilizados para uma primeira análise e validação da ferramenta. O pipeline foi testado usando genomas de 105 espécies de micoplasmas, todos recuperados de bancos de dados públicos. Ele foi implementado em Python 3, fazendo uso de bibliotecas auxiliares. Na primeira etapa do processamento, os grupos de ortólogos são identificados com a ferramenta OrthoFinder e, em seguida, são alinhados com os programas PRANK ou Clustal Omega, podendo ser aparados pela ferramenta trimAl. A ferramenta ModelTest-NG é usada para calcular o modelo evolutivo mais adequado para a reconstrução filogenética, que pode ser realizada com as ferramentas RAxML, PhyML, ou com o programa MrBayes. Dezesseis filogenias foram inferidas com a combinação dos métodos implementados no pipeline, cada uma usando sequências de 43 proteínas ortólogas identificadas em todas as espécies analisadas. Destas 16 filogenias, duas tiveram todos os ramos com suporte acima de 80%, ambas utilizando o alinhador PRANK e reconstrução por inferência bayesiana. Não houve diferença significativa no suporte ao comparar o resultado dos alinhadores e o nível de completude do alinhamento. Os métodos de inferência, entretanto, demonstraram ter impacto no suporte e na topologia, sendo a reconstrução por distância a melhor para solucionar a ordem dos grandes grupos. Todas as 16 filogenias reproduziram a topologia clássica de micoplasmas, validando a estratégia utilizada no Pipelution. ...
Abstract
As a result of new sequencing technologies, a large number of whole genome sequences has become available in public databases. These data boosted evolutionary studies based on comparative genomics using phylogenetic tools. Such theoretical and computational studies have provided clues on the processes that shaped the genomes of current species and have helped inferring their relationships. Bacteria of the Mycoplasma genus (mycoplasmas) constitute an interesting test case for a phylogenomic pipe ...
As a result of new sequencing technologies, a large number of whole genome sequences has become available in public databases. These data boosted evolutionary studies based on comparative genomics using phylogenetic tools. Such theoretical and computational studies have provided clues on the processes that shaped the genomes of current species and have helped inferring their relationships. Bacteria of the Mycoplasma genus (mycoplasmas) constitute an interesting test case for a phylogenomic pipeline, as they have some of the smallest genomes of known self-replicating organisms and new mycoplasma species have been identified and had their genomes sequenced. Therefore, in order to automate the process of phylogenomic analysis for phylogenetic reconstruction and inference of evolutive models, a pipeline called Pipelution was developed using mycoplasmas for its first analysis and validation. The pipeline was tested using the genomes of 105 mycoplasma species, all retrieved from public databases. In the developed pipeline, first, orthogroups are identified by OrthoFinder. Next, the ortholog groups are aligned by PRANK or Clustal Omega, with trimming by trimAl. ModelTest-NG is used to infer the best-fit evolutionary model for phylogenetic reconstruction, which can be performed by distance method, with RAxML, PhyML or MrBayes tools. Sixteen trees were inferred by the combination of methods implemented in the pipeline, each one using sequences of 43 proteins, with orthologs shared by all assessed species. Of these 16 phylogenies, two had all branches with support above 80%, both with alignment by PRANK and reconstruction with bayesian inference. There was no significant difference when the alignment algorithm and the level of completeness of alignment were compared. Inference methods had a major impact in support and topology and distance reconstruction was the best for solving inner great groups. All 16 phylogenies reproduced the classical topology of mycoplasmas, validating the strategy used in the developed pipeline. ...
Instituição
Universidade Federal do Rio Grande do Sul. Centro de Biotecnologia do Estado do Rio Grande do Sul. Programa de Pós-Graduação em Biologia Celular e Molecular.
Coleções
-
Ciências Biológicas (4121)
Este item está licenciado na Creative Commons License