A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
Fecha
2019Autor
Co-director
Nivel académico
Grado
Tipo
Resumo
As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O metabarcoding a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o gr ...
As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O metabarcoding a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. Pipelines de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o pipeline do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e pipelines para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes pipelines e variações dos parâmetros é recomendável. ...
Abstract
The complex microbiological communities found in many environments - including the human body - are the microbiota. The comprehension of its composition and operation is target to great scientific interest, in view of the scale of its interactions and functions in which it is involved. Metabarcoding using 16S rDNA data is, today, a method widely applied to studies of microbiota composition. In this context, bioinformatic analysis of the data generated face the great challenge of guaranteeing th ...
The complex microbiological communities found in many environments - including the human body - are the microbiota. The comprehension of its composition and operation is target to great scientific interest, in view of the scale of its interactions and functions in which it is involved. Metabarcoding using 16S rDNA data is, today, a method widely applied to studies of microbiota composition. In this context, bioinformatic analysis of the data generated face the great challenge of guaranteeing the quality and reproducibility of results. Standardized analysis pipelines are alternatives to this problem, however, using appropriate parameters may have direct impact in the results obtained. Therefore, the objective of this work is to clarify the influence of the parameters in the results of analysis of 16S rDNA from human gut, using as reference the BMP - Brazilian Microbiome Project - pipeline, and comparing the results of different combinations between minimum confidences, classifiers and clustering pipelines. Our results point to visible differences between the application of different parameters to the pipeline, having diverse effects in the quantity of identified taxa, classified OTUs and the precision of the classification. The results of combinations of classifiers and minimum confidences present variation between the two clustering pipelines, USEARCH showing little differences after altering the classifiers and VSEARCH great disparities - specially Mothur, whose results of number of identified taxa and classified OTUs were always above the others, even not responding to the increase in the minimum confidence. We also highlight the importance of the removal of chimeric sequences to the quality of results. Thereby, we point the importance of inclusion in microbiota studies of details of parameters and methods applied, guaranteeing the validation, quality and reproducibility of the result. It is essential to understand the applied pipelines and their parameters. Testing different pipelines and variations of parameters is recommendable. ...
Institución
Universidade Federal do Rio Grande do Sul. Instituto de Biociências. Curso de Biotecnologia.
Colecciones
-
Tesinas de Curso de Grado (37618)Tesinas Biotecnología (171)
Este ítem está licenciado en la Creative Commons License