Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Deciphering the molecular basis of the specificity of protein-carbohydrate interactions by statistical analysis of 3D structural data from the Protein Data Bank

Die Entzifferung molekularer Basis der Spezifität von Protein-Kohlehydrat Wechselwirkungen durch statistische Analyse von 3D Strukturdaten aus der Protein Data Bank

Rojas Macias, Miguel Angel


Zum Volltext im pdf-Format: Dokument 1.pdf (8.868 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-120199
URL: http://geb.uni-giessen.de/geb/volltexte/2016/12019/

Bookmark bei del.icio.us


Freie Schlagwörter (Deutsch): Protein-Kohlehydrat Wechselwirkungen , Bioinformatik , Glykobiologie , PDB , GlyVicinity
Freie Schlagwörter (Englisch): protein-carbohydrate interactions , bioinformatics , glycobiology , PDB , GlyVicinity
Universität Justus-Liebig-Universität Gießen
Institut: Institute of Veterinary Physiology and Biochemistry
Fachgebiet: Biochemie (FB 08)
DDC-Sachgruppe: Naturwissenschaften
Dokumentart: Dissertation
Sprache: Englisch
Tag der mündlichen Prüfung: 05.05.2015
Erstellungsjahr: 2014
Publikationsdatum: 11.04.2016
Kurzfassung auf Englisch: Glycoproteins, proteins with covalently attached sugar residues, are commonly found on the surface of almost all cells where they give rise to a vast layer called glycocalyx. The intricacy of this layer confers cells with a distinctive identity that is recognized by proteins and other receptors. Such protein-carbohydrate interactions set the basis for a broad range of essential biological events, including cell adhesion, signal transduction, the migration of leukocytes to sites of inflammation and the immunological response to carbohydrate antigens. Therefore, the need to comprehend these interactions in detail.
Carbohydrate-binding proteins show a remarkable specificity, being able to discern between very similar glycan residues. In order to better understand this precise specificity, the spatial vicinity of common monosaccharide residues is inspected in order to determine their amino acid preferences. Two datasets have been examined. Firstly, one composed of non-covalently bound carbohydrates ligands. The results of this analysis is compared to the second dataset, obtained from the study of the spatial vicinity of the monosaccharides that form the common structural core shared by different types of N-glycans. Amino acid patterns were determined based on two measures: absolute numbers and deviations from natural abundances. Superimposition of protein atoms made possible to display in more detail how interactions are established based on their stereochemical structure. This study is not limited to a given protein-carbohydrate complex, instead, all 3D structures of protein-carbohydrate complexes found in the Protein Data Bank are collected, clustered, and statistically analyzed.
The results show that polar amino acids are more frequently found in the vicinity of the analyzed monosaccharides than non-polar residues. Due to the hydrophilic nature of glycan residues, it is not surprising that the main force directing protein-carbohydrate interactions is hydrogen bonding. However, contacts between sugar residues and the non-polar surfaces of aromatic amino acids are confirmed to be also essential for the discrimination of carbohydrate residues. The role of Trp is especially remarkable since it is clearly overrepresented around all analyzed carbohydrate residues.
Monosaccharides display polar and non-polar patches on their surfaces that define the way in which interactions with proteins are established. Accordingly, changes in their conformations may also change the pattern of these patches and affect binding specificity. Linkages between proteins and glycans also influence the distribution of amino acids. For example, when comparing amino acids found in the spatial vicinity of N-glycans with those surrounding the glycosylation site, it is shown that the N-glycans interact mostly with amino acids located far from the glycosylation site. This suggests that N-glycans have a minor role at building a binding site, in contrast to non-covalently bound ligands.
This study proves that the Protein Data Bank can be effectively used as indirect source of carbohydrate 3D data. The results constitute a guide on the type of amino acid preferences that each of the analyzed monosaccharides display. The statistical analysis was performed with a bioinformatics application that was redeveloped for this purpose. This software is publicly accessible, and different parameters can be used to refine the search space. Even if the number of entries is small, in some cases the results are interesting since they indicate the beginning of a pattern which can be later corroborated once the number of entries increases.
Kurzfassung auf Deutsch: Glykoproteine sind Proteine mit kovalent gebunden Zuckerresten und werden normalerweise an der Oberfläche aller Zellen gefunden, wo sie eine große Schicht bilden, die Glykokalyx genannt wird. Die Komplexität dieser Schicht verleiht Zellen eine unverwechselbare Identität, die von Proteinen und anderen Rezeptoren erkannt wird. Die Wechselwirkungen zwischen Proteinen und Kohlenhydraten bilden die Grundlage für eine große Anzahl von wichtigen biologischen Vorgängen, wie zum Beispiel Zelladhäsion, Signalübertragung, Wanderung von Blutleukozyten zu Entzündungsherden und Immunreaktionen auf Kohlenhydrat-Antigene.
Kohlenhydrat-bindende Proteine zeigen eine bemerkenswerte Spezifität. Sie sind in der Lage, zwischen sehr ähnlichen Glykanresten zu unterscheiden. Um diese genaue Spezifität besser zu verstehen, wird die räumliche Nähe bekannter Monosaccharide untersucht, um ihre Aminosäurepräferenz zu bestimmen. Zwei Datensätze sind geprüft worden. Zuerst wurden alle nicht-kovalent gebundenen Aminosäuren in Protein-Kohlenhydrat Komplexen ausgewählt. Die Ergebnisse wurden mit dem zweiten Datensatz verglichen, den man aus der Analyse der räumlichen Nähe der Monosaccharide erhält, welche den gemeinsamen strukturellen Kern durch unterschiedliche Arten von N-Glykanen bilden. Aminosäuremuster wurden auf zwei Wege bestimmt: Absolute Zahlen und Abweichungen von den natürlichen Häufigkeiten. Die Überlagerung von Proteinatomen erlaubt im Detail zu erkennen, wie Interaktionen auf der Grundlage ihrer stereochemischen Struktur
stattfinden. Diese Studie ist nicht auf ein bestimmtes Protein-Kohlenhydrat-Komplex beschränkt, sondern es werden alle 3D-Strukturen von Protein-Kohlenhydrat-Komplexen in der Protein Data Bank gefunden, gesammelt, gruppiert und statistisch analysiert.
Die Ergebnisse zeigen, dass polare Aminosäuren häufiger in der Nähe der untersuchten Monosaccharide gefunden werden als nicht-polare Reste. Aufgrund der hydrophilen Natur der Kohlenhydrate ist es nicht verwunderlich, dass die Hauptkraft, die die Protein-Kohlenhydrat-Wechselwirkungen bestimmt, die Wasserstoffbrückenbindung ist. Allerdings konnte gezeigt werden, dass auch die Kontakte zwischen Zuckerresten und nicht-polaren Flächen der aromatischen Aminosäuren für die Unterscheidung von Kohlenhydratresten wesentlich sind. Die Rolle von Trp ist besonders bemerkenswert, da es bei allen betrachteten Kohlenhydratresten überrepräsentiert ist.
Monosaccharide haben polare und unpolare Bereiche auf ihrer Oberfläche, die die Art und Weise der Wechselwirkung mit Proteinen definieren. Daher können Änderungen in ihrer Anordnung zu einer Änderung im Muster dieser Bereiche führen und auch die Bindungsspezifität beeinflussen. Verbindungen zwischen Proteinen und Glykanen beeinflussen auch die Verteilung der Aminosäuren. Bei einem Vergleich zwischen Aminosäuren in der räumlichen Nähe von N-Glykanen und denen, die eine Glykosilierungsstelle umgeben, zeigt sich, dass N-Glykane eher mit Aminosäuren interagieren, die sich weiter von der Glykosilierungsstelle entfernt befinden. Dies legt nahe, dass N-Glykane eine unterge-ordnete Rolle beim Aufbau einer Bindungsstelle spielen, im Gegensatz zu nicht-kovalent gebundenen Liganden.
Diese Studie beweist, dass die Protein Data Bank sehr effektiv als indirekte Quelle von 3D-Daten auf Kohlenhydrate angewendet werden kann. Die Ergebnisse bilden einen Leitfaden darüber, wie die untersuchten Monosaccharide mit unterschiedlichen Aminosäuren interagieren. Die statistische Analyse wurde mit einer Bioinformatikanwendung, die für diesen Zweck komplett überarbeitet wurde, durchgeführt. Diese Software ist öffentlich zugänglich und kann angepasst werden, um neue Parameter zu akzeptieren und verschiedene Suchaufträge durchzuführen sobald sich die Anzahl der Einträge erhöht hat. Auch wenn die Anzahl der Einträge in einigen Fällen noch gering ist, sind die Ergebnisse interessant, da sie den Anfang eines Musters zeigen, das später, wenn die Datenmenge steigt, bestätigt werden kann.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand