Desenvolvimento de uma pipeline para a análise sistemática da qualidade da informação sacarídica do Protein Data Bank (PDB)
Visualizar/abrir
Data
2025Autor
Orientador
Nível acadêmico
Graduação
Assunto
Resumo
Carboidratos compreendem uma das famílias de biomoléculas mais diversa e abundante na natureza. Mais de 250 diferentes monossacarídeos, a menor unidade dos carboidratos, já foram identificados. Suas características estereoquímicas permitem que eles se apresentem nas configurações D e L. Além disso, monossacarídeos podem se unir através de ligações glicosídicas e formar estruturas mais complexas como dissacarídeos, oligossacarídeos e polissacarídeos. Essa ligação é flexível e pode se dar de dife ...
Carboidratos compreendem uma das famílias de biomoléculas mais diversa e abundante na natureza. Mais de 250 diferentes monossacarídeos, a menor unidade dos carboidratos, já foram identificados. Suas características estereoquímicas permitem que eles se apresentem nas configurações D e L. Além disso, monossacarídeos podem se unir através de ligações glicosídicas e formar estruturas mais complexas como dissacarídeos, oligossacarídeos e polissacarídeos. Essa ligação é flexível e pode se dar de diferentes formas a depender do tipo de monossacarídeo envolvido e da configuração espacial da ligação. Em solução, os monossacarídeos tendem a se organizar em forma de anel, podendo adotar as configurações α ou β conforme a orientação do grupo hidroxila ligado ao carbono anomérico. A soma de todas essas características inerentes confere aos carboidratos uma grande variedade estrutural, permitindo que eles desempenhem múltiplas funções biológicas, como armazenamento de energia, sinalização celular e formação de estruturas extracelulares. Sua flexibilidade estrutural, aliada à limitação dos métodos experimentais e às inconsistências em sua anotação, são a razão pela qual sua representação tridimensional no Protein Data Bank (PDB) têm sido um desafio. Com o objetivo de aprimorar a representação de açúcares no banco, novas ferramentas de curadoria e padronização foram implementadas. Nesse contexto, este trabalho oferece uma visão abrangente das estruturas de carboidratos presentes atualmente no PDB. Através de uma análise sistemática foram classificadas, quantificadas e caracterizadas as informações gerais dos açúcares do banco e definidas as conformações de piranoses utilizando as coordenadas de puckering de Cremer-Pople. Os resultados apontaram que os dados atuais de carboidratos no PDB estão concentrados em pequenas cadeias e uma pequena quantidade de resíduos de açúcar. Uma correlação entre conformações distorcidas de piranoses e baixas resoluções experimentais foi identificada. Nesse caso, observou-se que muitas conformações incomuns podem ser artefatos experimentais, mesmo em estruturas de alta resolução. Para apoiar futuras pesquisas, foi desenvolvida a CarboVault, uma plataforma web interativa que permite a exploração e análise da informação sacarídica contida no PDB. Essa ferramenta tem como objetivo fornecer insights sobre a diversidade e conformação dos carboidratos, e esperamos que ela fomente novas contribuições nesta área relativamente inexplorada da biologia estrutural. ...
Abstract
Carbohydrates are among the most diverse and abundant families of biomolecules in nature. Over 250 different monosaccharides, the smallest unit of carbohydrates, have been identified. Their stereochemical characteristics allow them to exist in both D and L configurations. Moreover, monosaccharides can link through glycosidic bonds to form more complex structures, such as disaccharides, oligosaccharides, and polysaccharides. These bonds are flexible and can occur in different ways depending on t ...
Carbohydrates are among the most diverse and abundant families of biomolecules in nature. Over 250 different monosaccharides, the smallest unit of carbohydrates, have been identified. Their stereochemical characteristics allow them to exist in both D and L configurations. Moreover, monosaccharides can link through glycosidic bonds to form more complex structures, such as disaccharides, oligosaccharides, and polysaccharides. These bonds are flexible and can occur in different ways depending on the type of monosaccharide involved and the spatial configuration of the linkage. In solution, monosaccharides tend to adopt a ring form, which can exhibit either α or β configurations depending on the orientation of the hydroxyl group attached to the anomeric carbon. These inherent characteristics grant carbohydrates a vast structural variety, enabling them to perform multiple biological functions, such as energy storage, cellular signaling, and the formation of extracellular structures. Their structural flexibility, coupled with limitations in experimental methods and inconsistencies in their annotation, has made the accurate three-dimensional representation of carbohydrates in the Protein Data Bank (PDB) a significant challenge. To improve the representation of sugars in the database, new tools for data curation and standardization have been implemented. In this context, this study provides a comprehensive overview of the carbohydrate structures currently present in the PDB. Through a systematic analysis, the general information on sugars in the database was classified, quantified, and characterized, and pyranose conformations were defined using Cremer-Pople puckering coordinates. The results showed that carbohydrate data in the PDB are predominantly concentrated in small glycan chains and a limited number of sugar residues. A correlation between distorted pyranose conformations and low experimental resolutions was identified. In these cases, many unusual conformations were found to likely be experimental artifacts, even in high-resolution structures. To support future research, CarboVault, an interactive web-based platform, was developed to enable the exploration and analysis of saccharide information in the PDB. This tool aims to provide insights into the diversity and conformations of carbohydrates, and it is hoped that it will foster new contributions to this relatively underexplored area of structural biology. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Ciências Básicas da Saúde. Curso de Biomedicina.
Coleções
-
TCC Biomedicina (283)
Este item está licenciado na Creative Commons License
