Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Elucidating the potential of microRNAs : towards a functional landscape of microRNAs in the model organisms Tribolium castaneum and Galleria mellonella

Beleuchtung des Potenzials von microRNAs : auf dem Weg zu einer funktionalen microRNA Landschaft in den Modellorganismen Tribolium castaneum und Galleria mellonella

Amsel, Daniel


Zum Volltext im pdf-Format: Dokument 1.pdf (33.907 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-160133
URL: http://geb.uni-giessen.de/geb/volltexte/2021/16013/


Freie Schlagwörter (Deutsch): microRNA , Bioinformatik , Pipeline , microPIECE , CLIP-seq
Freie Schlagwörter (Englisch): microRNA , bioinformatics , pipeline , microPIECE , CLIP-seq
Universität Justus-Liebig-UniversitĂ€t Gießen
Institut: Institut fĂŒr Insektenbiotechnologie
Fachgebiet: Agrarwissenschaften, Ökotrophologie und Umweltmanagement fachĂŒbergreifend
DDC-Sachgruppe: Naturwissenschaften
Dokumentart: Dissertation
Sprache: Englisch
Tag der mĂŒndlichen PrĂŒfung: 30.03.2021
Erstellungsjahr: 2020
Publikationsdatum: 07.04.2021
Kurzfassung auf Englisch: Insects have been utilized by humans for thousands of years. At first in a very primitive way as direct food provider for example for honey or as material source like lac dye or silk. Nowadays, with emerging technical possibilities, resources and needs, the usage of insects, as the world’s largest animal class, is getting much more skillful.
Technologies like Next Generation Sequencing emerged in the past decades, enabling a broad scientific community to study organisms, like insects, at a molecular genetic level for a comparable cheap price. This technological jump led to findings that promoted insects as valuable model organisms and resource of molecules for various applications. For example, the study of effects of pathogens to an insect organism and a potential transfer of knowledge to humans.
One of the emerging fields in the molecular genetic research is the investigation of gene expression regulation by microRNAs. Since their misregulation can lead to serious malformations of body parts, cancer and even death, the large research community is diversified and the numbers of microRNA publications is increasing to nearly 18,000 per year. Despite their popular impact, the in silico analysis of microRNAs needs the knowledge of a broad portfolio of task-specific tools and settings in order to compute results. Furthermore, due to their small size of only around 21 nucleotides, the assignment of a corresponding mRNA is a non-trivial task, leading to a broad variety of approaches in the laboratory and in silico. On the one hand, the target prediction algorithms mostly try to generalize microRNA behavior and filter for microRNA-mRNA bindings with these features. This leads to a large number of false-positives. On the other hand, many of the laboratory approaches are not high- throughput, making a validation of microRNA targets time consuming. With Next Generation Sequencing, certain methods (like CLIP-sequencing) are able to raise signals of microRNA binding sites on mRNAs in a high-throughput manner. However, these methods have the drawback that they are very difficult to perform. Datasets are therefore very rare in public databases. Within this thesis I present the assessment of a best practice workflow for microRNA analysis, providing a guideline for other researchers. My benchmarking of microRNA isoform tools not only identified the most suitable tool for high-throughput pipelines, but also highlighted the broader impact on microRNA isoforms in Tribolium castaneum early development. Outgoing from the assessment, I created a scripted workflow which was then translated into a novel pipeline, called microPIECE, covering the widely used microRNA analysis tasks, including microRNA isoform detection, combined with a novel microRNA target prediction approach that relies on transferred and evolutionary conserved CLIP-sequencing data from closely related species. This approach makes the previously mentioned rare data available to other species.
Finally, I applied my pipeline exemplarily to Galleria mellonella in order to identify the impact of microRNAs to the immune response against pathogenic Escherichia coli strains, indicating a benefit for human pathogen investigations and shedding light on a potential insect utilization for humans.
The results of my research are publicly available in three different scientific journals (BMC Bioinformatics, JOSS- Journal of Open Source Software and Nature Scientific Reports). The source code of the microPIECE pipeline, as well as a Docker environment is available via GitHub.com.
Kurzfassung auf Deutsch: Insekten wurden bereits vor Tausenden von Jahren vom Menschen genutzt. Zuerst nur auf eine sehr primitive Art und Weise als Nahrungsquelle fĂŒr beispielsweise Honig oder als Quelle fĂŒr Material, wie beispielsweise Schellack oder Seide. Heutzutage, mit voranschreitenden technischen Möglichkeiten, Ressourcen und Methoden, wird die Nutzbarkeit von Insekten, als weltweit grĂ¶ĂŸte Tierklasse, um einiges anspruchsvoller.
Technologien wie Next Generation Sequencing kamen im Laufe der letzten Dekaden hinzu und ermöglichten einer breiten wissenschaftlichen Community die Erforschung von Organismen, wie beispielsweise Insekten, auf einer molekulargenetischen Ebene, zu einem vergleichsweisen gĂŒnstigen Preis. Dies fĂŒhrte zu Entdeckungen, die Insekten als wertvolle Modell- Organismen qualifizierte. Beispielsweise konnte die molekulargenetische Auswirkung von Pathogenen auf den Organismus von Insekten untersucht werden, deren Ergebnisse RĂŒckschlĂŒsse auf die Funktion im Menschen ermöglichen.
Eines der aufstrebenden Bereiche in der Molekulargenetik ist die Erforschung von Genexpressions-Regulation durch microRNAs. Eine Fehlregulation dieser microRNAs kann zu schwerwiegenden Fehlbildungen von Körperteilen, Krebs und sogar zum Tode fĂŒhren. Dementsprechend divers ist auch die Forschungs-Community und die Zahl der microRNA Publikationen steigt auf fast 18.000 Artikel pro Jahr. Trotz ihres populĂ€ren Einflusses ist die in silico Analyse von microRNAs immer noch anspruchsvoll und benötigt eine große Anzahl an spezifischen Programmen und Einstellungen zur Auswertung der Rohdaten. Weiterhin ist die Bestimmung von mRNA Zielgenen aufgrund der recht kleinen GrĂ¶ĂŸe von durchschnittlich 21 Nukleotiden der microRNAs keine einfache Aufgabe. Dies fĂŒhrte zu einer Vielzahl an LösungsansĂ€tzen, sowohl im Labor, als auch in silico. Auf der einen Seite versuchen sogenannte Target-Prediction-Algorithmen das Verhalten von microRNAs zu generalisieren und nach microRNA-mRNA Bindungen mit diesen Eigenschaften zu filtern. Das fĂŒhrt zu einer großen Zahl von Falsch-Positiven. Auf der anderen Seite sind viele der im Labor eingesetzten Methoden zur Validierung nicht fĂŒr den Hochdurchsatz geeignet, was die Validierung der Vorhersagen zeitaufwĂ€ndig macht. Mit Hilfe von Next Generation Sequencing wurden Methoden (wie bspw. CLIP-Sequenzierung) etabliert, die es ermöglichen microRNA Bindestellen im Hochdurchsatz zu identifizieren. Jedoch haben diese Methoden den Nachteil, dass sie schwierig umzusetzen sind und ihre DatensĂ€tze deshalb auch selten in öffentlich Datenbanken zu finden sind.
In dieser Thesis prĂ€sentiere ich das Assessment eines Best-Practice Workflows fĂŒr die microRNA Analyse, die als Leitfaden fĂŒr andere Wissenschaftler (m/w/d) dienen kann. Mein Benchmark von microRNA Isoform Analyse-Programmen hat nicht nur das beste Tool fĂŒr die Hochdurchsatz Analyse identifiziert, es hat auch den Einfluss von microRNA Isoformen im frĂŒhen Entwicklungsstadium von Tribolium castaneum beleuchtet. Ausgehend von diesem Assessment habe ich einen Workflow mit einzelnen Skripten entwickelt, der wiederum in eine zusammenhĂ€ngende Pipeline mit dem Namen microPIECE konvertiert wurde. Sie deckt die am weitesten verwendeten microRNA Analysen ab, inklusive microRNA Isoform Detektion, in Kombination mit meinem neu entwickelten Zielvorhersage-Ansatz, welcher auf den Transfer von evolutionĂ€r konservierten CLIP-Sequenzierdaten von nah verwandten Spezies setzt. Diese Methode macht die vorher erwĂ€hnten, seltenen DatensĂ€tze auch fĂŒr andere Spezies nutzbar.
Schließlich habe ich meine Pipeline exemplarisch an Galleria mellonella angewendet, um den Einfluss von microRNAs auf die Immunantwort gegenĂŒber pathogenen Escherichia coli StĂ€mmen zu identifizieren und eine mögliche Übertragbarkeit auf den Menschen herzustellen.
Die Ergebnisse meiner Forschungen sind öffentlich verfĂŒgbar und in drei verschiedenen wissenschaftlichen Journalen erschienen (BMC Bioinformatics, JOSS – Journal of Open Source Software und Nature Scientific Reports). Der Quellcode der microPIECE Pipeline, sowie die Docker-Umgebung sind auf Github.com verfĂŒgbar.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand