Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
dc.contributor.advisor | Prolla, Patrícia Ashton | pt_BR |
dc.contributor.author | Scheid, Marina Roberta | pt_BR |
dc.date.accessioned | 2019-09-10T03:38:17Z | pt_BR |
dc.date.issued | 2018 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/199014 | pt_BR |
dc.description.abstract | Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares. | pt_BR |
dc.description.abstract | After the introduction of the massive parallel sequencing for genetic diagnostic tests through gene panels for hereditary cancer predisposing genes there was a significant increasing in the number of detected variants. A great proportion of these variants are synonymous variants (SVs), and most of them are inferred to be benign, without undergoing pathogenicity assessment. However, it is estimated that a small but significant percentage of SVs are capable of altering gene expression whether they are inserted in conserved regions, such as splicing sites, CpG islands, or altering the secondary mRNA conformation. In this work, we evaluated the accuracy of free-access in silico tools that analyze SVs. We also evaluated SVs obtained from a public database (ExAC) and from genetic testing results from a cancer risk assessment clinic. In silico tools selected for the analysis belong to three groups: tools to evaluate nucleotide conservation (PhasCons and PhyloP), multiple annotation (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA and SilVA), and splicing (SSF, NNSplice, MaxEntScan and GeneSplicer). The Receiver Opearting Characteristic (ROC) curve was carried out for sensibility and specificity analysis of each tool using SPSS software. Analysis of secondary structure and difference of mRNA energy folding (ΔMEF) were performed by RNAfold and the presence of CpG island by MethPrimer. The software SilVA presented the highest accuracy between all multiple annotation in silico selected tools, and only GWAVA did not show significant values of area under the curve (AUC). All conservation and splicing tools selected presented significant values of AUC. Of the 4,324 SVs selected from ExAC, SilVA classified approximately 1% as likely or potentially pathogenic. Analysis by other in silico predictors demonstrated that splicing alterations could be the main mechanism involved in the pathogenicity mechanism of this group of variants. Regarding variants identified in the second group, SVs were filtered by global minor allelic frequency lower than 0.05 and fourteen SVs were selected in TP53 (n=3), BRCA1 (n=2) and BRCA2 (n=9). Structural analyses demonstrated that two SVs in the TP53 gene (c.66A>G and c.108G>A) were predicted to change the folding energy or structure of the mRNA. We also found that c.1395A>C and c.3756A>T, both in the BRCA2 gene, could result in splicing disruption according to in silico splicing tools. This was the first study to evaluate the accuracy of in silico tools for SVs in a comprehensive set of cancer predisposing genes. However, further analysis are still required to confirm the pathogenic potential of SVs. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Neoplasias | pt_BR |
dc.subject | Synonymous variants | en |
dc.subject | Predisposição genética para doença | pt_BR |
dc.subject | BRCA1 and BRCA2 | en |
dc.subject | Análise de sequência | pt_BR |
dc.subject | TP53 | en |
dc.subject | Mutação | pt_BR |
dc.subject | Hereditary breast and ovarian cancer | en |
dc.subject | Li-Fraumeni Syndrome | en |
dc.subject | Biologia computacional | pt_BR |
dc.subject | RNA mensageiro | pt_BR |
dc.subject | Hereditary cancer predisposing syndromes | en |
dc.subject | Silent mutation, hereditary cancer | en |
dc.subject | Synonymous mutation | en |
dc.title | Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer | pt_BR |
dc.type | Dissertação | pt_BR |
dc.identifier.nrb | 001092309 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Faculdade de Medicina | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Medicina: Ciências Médicas | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2018 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Este item está licenciado na Creative Commons License
-
Ciências da Saúde (9127)Ciências Médicas (1557)