Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Comparative genomics of pathogenic lineages of Listeria monocytogenes : A bioinformatic approach

Komparative Genomik pathogener Abstammungslinien der Spezies Listeria monocytogenes : Ein bioinformatischer Ansatz

Künne, Carsten Tobias


Zum Volltext im pdf-Format: Dokument 1.pdf (9.830 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-101043
URL: http://geb.uni-giessen.de/geb/volltexte/2013/10104/

Bookmark bei Connotea Bookmark bei del.icio.us


Freie Schlagwörter (Deutsch): Pangenomik , Bioinformatik , Evolution , Visualisierung , Listeria
Freie Schlagwörter (Englisch): pangenome , bioinformatics , evolution , visualization , listeria
Universität Justus-Liebig-Universität Gießen
Institut: Institut für Medizinische Mikrobiologie
Fachgebiet: Medizin fachübergreifend
DDC-Sachgruppe: Biowissenschaften, Biologie
Dokumentart: Dissertation
Sprache: Englisch
Tag der mündlichen Prüfung: 18.06.2013
Erstellungsjahr: 2012
Publikationsdatum: 02.10.2013
Kurzfassung auf Englisch: In this thesis, a general approach to complete de novo sequencing, annotation and bioinformatic analyses of bacterial genomes and pan-genomes was devised and implemented. The tools developed and implemented were used to process and analyse genome- and transcriptome-based data that allowed a reconstruction on the phylogeny of the genus Listeria and the evolution of adaptation traits enabling its survival in the intracellular environment.
An efficient finishing pipeline was constructed using a combination of commercial and open source components connected by self-written software that was successfully employed for the assembly of one bacterial chromosome and five plasmids. In order to achieve a congruent and exact annotation for 12 chromosomes and 18 plasmids, a modular comparative annotation system was created including rapid primary automatic annotation followed by manual corrections that can be easily used to predict functions for a large amount of prokaryotic replicons simultaneously.
Considerable extensions to the author’s previously published GECO comparative analysis suite were implemented to assess relations of prokaryotic strains inside pan-genomes. These can be employed to (i) predict the total size of a pan-genome, as well as the distribution of conservation to identify indels supporting taxonomic or phenotypic divisions, (ii) rapidly export data necessary for the construction of phylogenomic and phenotypical trees to delineate between minor mutations and horizontal gene transfer, (iii) to identify and visualize diverging regions inside related replicons to recognize hyperdynamic hotspots, mobile elements and prophages, (iv) and to comparatively visualize limited regions for detailed assessment. A public GECO-LisDB comparative analysis server was set up bearing the largest number of completely sequenced listeriae available to date [97].
In order to allow comparative identification of small non-coding RNAs, a client/server software called sRNAdb was devised, which can rapidly detect the presence of sRNAs inside complete replicons.
These pipelines were employed for evolutionary analysis of genus Listeria focusing on pathogenic species L. monocytogenes. All compared chromosomes of the species displayed extensive similarities indicative of a highly conserved functionality. Observed differences between phylogenetic trees indicate that minor SNP variations may have a profound impact on adaptation and thus available niches, while gene-scale indels often associated with horizontal gene transfer are rarely conserved. Most duplications found inside the genus are ancient and do not contribute to current evolutionary adaptation of listeriae.
Differentially distributed genes were predominantly found in nine highly variable regions or as a part of rare mobile genetic elements or prophages, highlighting the stability of the backbone of the species. Interestingly, only a subset of strains displayed putatively functional CRISPR adaptive immune systems of different types, or other identifiable defences against aggressive foreign DNA, indicating other factors to sustain the observed chromosomal stability, which now deserves further attention.
A further factor expanding the genomes in a subset of strains is represented by plasmids, which putatively descended from a common ancestor. Plasmid-encoded genes with identifiable functions frequently belonged to the category of stress response, which may be most beneficial in defence against disinfectants applied in food processing environments.
New candidate genes that may influence virulence of Listeria were predicted based on their phylogenetic distribution, functional domains and intracellular expression. Prophage-related genes had a major effect on intracellular survival of listeriae as recognized by attenuated virulence of deletion mutants.
Loss of virulence was previously identified as a recurring pattern of listerial evolution and could be seen in genomes, intracellular expression and phenotypes of several compared strains of all lineages, especially lineage III. This indicates a drift towards an obligate saprophytic or commensal lifestyle within the eukaryotic host, which may support exchange of genetic information in the nutrient-rich gastrointestinal tract and serve as a vector for transportation to a new location.
In conclusion, these studies aimed at the development of pipelines intended for the identification of evolutionary patterns within the pan-genome of Listeria monocytogenes and related species and uncovered new candidate genes valuable for diagnostics and virulence research.
Kurzfassung auf Deutsch: Im Verlauf dieser Dissertation wurden Werkzeuge entworfen und implementiert, die die vollständige de novo Sequenzierung, Annotation und bioinformatische Analyse von bakteriellen Genomen und Pan-Genomen erlauben. Diese wurden eingesetzt um Genom- und Transkriptomdaten zum Zwecke der phylogenetischen Rekonstruktion des Genus Listeria zu untersuchen und die evolutionäre Anpassung an die intrazelluläre Nische zu analysieren.
Hierzu wurde eine effiziente Pipeline konstruiert, die die nötigen Schritte der Sequenzierung von der Assemblierung bis zum Lückenschluss umfasst. Diese basiert auf einer Kombination kommerzieller und freier Software, die durch eigens entwickelte Programme verbunden wurden und erfolgreich zur Sequenzierung eines bakteriellen Chromosoms und fünfer Plasmide eingesetzt werden konnten. Weiterhin wurde ein modulares komparatives Annotationssystem erstellt, welches eine gleichmäßige parallele Annotation mehrerer bakterieller Genome ermöglicht. Mit dessen Hilfe wurden 12 prokaryotische Chromosomen und 18 Plasmide annotiert.
Die bereits publizierte GECO Plattform zur komparativen Genomanalyse wurde um mehrere leicht zugängliche Werkzeuge zur Pangenom-Analyse erweitert. Diese können eingesetzt werden, (i) um die erwartete Größe eines Pangenoms vorherzusagen und den Grad der Konservierung einzelner Insertionen und Deletionen zu bestimmen, welche ausschlaggebend für taxonomische oder phenotypische Gruppen sind, (ii) um rasch Daten zu exportieren, die zur Erstellung phylogenetischer oder phenotypischer Bäume genutzt werden können, um die möglichen Auswirkungen von geringfügigen Mutationen und horizontalem Gentransfer gegenüberzustellen, (iii) um divergente Regionen in mehreren Genomen zu identifizieren, was zur Erkennung hyperdynamischer Hotspots, mobiler Elemente und Prophagen genutzt werden kann, (iv) und um begrenzte Regionen im Detail komparativ zu visualisieren. Ein öffentlicher GECO Webserver wurde aufgesetzt, der diese Funktionalität für die zur Zeit größte Anzahl vollständig sequenzierter Listerien-Genome zur komparativen Analyse bereitstellt [97].
Weiterhin wurde eine Software (sRNAdb) entwickelt, welche die rasche Identifizierung und Visualisierung von kleinen nicht-kodierenden RNAs aufgrund von Sequenzähnlichkeiten erlaubt.
Diese Pipelines wurden zur Analyse der Evolution des Genus Listeria und besonders der pathogenen Spezies L. monocytogenes eingesetzt.
Alle verglichenen Chromosomen der Spezies zeigten weitreichende Ähnlichkeiten, was auf einen hohen Grad an Verwandtschaft hindeutet. Die beobachteten Unterschiede zwischen phylogenetischen Bäumen zeigen, dass geringfügige Mutationen starke Auswirkungen auf die Anpassung an verschiedene Nischen haben, während Insertionen und Deletionen vollständiger Gene häufig mit flüchtigem horizontalem Gentransfer assoziiert sind. Die große Mehrzahl der Duplikationen im Genus stammt aus der Zeit vor der Aufspaltung in einzelne Spezies, welche somit zur laufenden evolutionären Anpassung der Listerien wenig beitragen.
Differentiell verteilte Gene wurden hauptsächlich in wenigen hyperdynamischen Regionen oder als Bestandteil von Prophagen und mobilen Elementen gefunden, was die hohe Stabilität der listeriellen Chromosomen hervorhebt. Diese beruht jedoch nicht auf der Präsenz von CRISPR Immunsystemen oder anderen identifizierbaren Gegenmaßnahmen, die den Einbau von fremder DNA verhindern, sondern könnte eine Folge einer bereits erreichten annähernd optimalen Anpassung sein.
Die Genome einiger Stämme werden außerdem durch Plasmide erweitert, welche vermutlich von einem gemeinsamen Vorfahren abstammen. Auf diesen extrachromosomalen Elementen fanden sich Gene, die häufig mit der Anpassung an Streßsituationen (Desinfektionsmittel, Antibiotika) assoziiert waren und so zum Überleben in Produktionsanlagen der Lebensmittel verarbeitenden Industrie beitragen können.
Weiterhin wurden mit Hilfe der phylogenetischen Verteilung, der Präsenz funktionaler Domänen, sowie der intrazellulären Expression neue Gene identifiziert, welche möglicherweise zur Virulenz oder Pathogenität von Listerien beitragen. Eingeschränkte Virulenz von Deletions-Mutanten hat gezeigt, dass einige Prophagen-assoziierte Gene auf noch unbekannte Art zur intrazellulären Anpassung beisteuern.
Die Verringerung der Virulenz wurde bereits als verbreitetes evolutionäres Muster von Spezies L. monocytogenes beschrieben, was die vorliegende Arbeit durch Genom-, Transkriptom- und phenotypische Daten bestätigen konnte, insbesondere hinsichtlich der Abstammungslinie III. Diese weist auf eine Verschiebung in Richtung eines obligat saprophytischen oder kommensalen Lebensstiles innerhalb eines eukaryotischen Wirtes hin, was den Austausch von genetischer Information im nährstoff- und bakterienreichen Gastrointestinaltrakt begünstigen könnte. Der Wirt dient vermutlich außerdem als Transportmittel um eine Verteilung der Listerien zu gewährleisten.
Zusammenfassend läßt sich sagen, daß in den zugrundeliegenden Publikationen bioinformatische Pipelines erstellt und angewandt wurden, welche zur Aufklärung evolutionärer Muster des Pangenoms von Listeria monocytogenes und verwandter Spezies genutzt werden konnten. Weiterhin wurden neue Gene identifiziert, welche zu zukünftigen diagnostischen Methoden beitragen können oder möglicherweise mit der Virulenz einzelner Stämme im Zusammenhang stehen.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand