Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Implementation of genome-wide prediction methods in applied plant breeding programs

Implementierung genomweiter Vorhersagemodelle in angewandten Pflanzenzüchtungsprogrammen

Hofheinz, Nina


Zum Volltext im pdf-Format: Dokument 1.pdf (2.149 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-111252
URL: http://geb.uni-giessen.de/geb/volltexte/2014/11125/

Bookmark bei Connotea Bookmark bei del.icio.us


Freie Schlagwörter (Deutsch): Agrarwissenschaften , Pflanzenzüchtung , Populationsgenetik , genomweite Vorhersage , genomische Selektion
Freie Schlagwörter (Englisch): Agricultural sciences , plant breeding , population genetics, genome-wide prediction , genomic selection
Universität Justus-Liebig-Universität Gießen
Institut: Institut für Pflanzenbau und Pflanzenzüchtung II
Fachgebiet: Agrarwissenschaften und Umweltmanagement
DDC-Sachgruppe: Landwirtschaft
Dokumentart: Dissertation
Sprache: Englisch
Tag der mündlichen Prüfung: 10.10.2014
Erstellungsjahr: 2014
Publikationsdatum: 21.10.2014
Kurzfassung auf Englisch: Genome-wide prediction (GWP) was suggested in order to overcome the shortcomings of quantitative trait loci mapping and marker-assisted selection. Genetic effects of markers are simultaneously estimated with a statistical GWP method in an estimation set consisting of genotyped and phenotyped individuals. The objective of the present study was the development of novel ridge regression methods that improve existing GWP methods with respect to accuracy of predicted genotypic values, accuracy of marker effect estimates and computational efficiency. For this purpose, their properties were compared in simulated data and data sets from applied plant breeding programs of maize, wheat and sugar beet.

Prediction of test cross performance was investigated for the first time with an independent validation of a data set originating from two subsequent breeding cycles of an applied sugar beet breeding program. It was demonstrated that genetic effects which were estimated in a certain cycle of a breeding program can be used for prediction of genotypic values in the subsequent breeding cycle, if the trait under consideration has a high heritability, as for example sugar content. For the prediction of genotypic values, ridge regression employing preliminary estimates of the heritability (RIR) was the fastest GWP method among those employing homoscedastic marker variances.

Accurate estimation of the true genetic effects for each marker is an important criterion for heteroscedastic GWP methods, if they are used for the identification of functional genes for gene introgression or the prediction of the performance of crosses. A modification of the expectation-maximization algorithm that yields heteroscedastic marker variances (RMLV) and ridge regression with weighing factors according to analysis of variance components (RRWA) provide alternative solutions to the computationally demanding Bayesian methods. RRWA outperformed all of the investigated GWP methods employing heteroscedastic marker variances in terms of computational efficiency. Most accurate marker effects in a simulated data set were estimated using RMLV, especially in situations with long LD stretches along the chromosomes and high marker densities, which often occur in plant breeding programs.

It can be concluded that the proposed novel ridge regression methods are promising for providing accurate predictions of genotypic values, accurate marker effect estimates and computational efficiency.
Kurzfassung auf Deutsch: Genomweite Vorhersage wurde entwickelt, um die Mängel der QTL-Kartierung und der markergestützten Selektion zu überwinden. Die genetischen Effekte der Marker werden mittels einer statistischen Methode gleichzeitig in einem Schätzdatensatz, welcher genotypisierte und phänotypisierte Individuen beinhaltet, geschätzt. Das Ziel der vorliegenden Arbeit war die Entwicklung neuartiger Ridge-Regressions Methoden, welche die bisherigen Methoden zur genomweiten Vorhersage in Bezug auf Genauigkeit der geschätzten genotypischen Werte, Genauigkeit der geschätzten Markereffekte und rechnerische Effizienz verbessern. Zu diesem Zweck wurden die Eigenschaften der Methoden verglichen, und zwar anhand eines simulierten Datensatzes und solchen aus angewandten Pflanzenzüchtungsprogrammen von Mais, Weizen und Zuckerrübe.

Die Vorhersage der Testkreuzleistung wurde erstmalig mit einer unabhängigen Validierung eines Datensatzes, der aus zwei nachfolgenden Zuchtzyklen eines Zuckerrübenzuchtprogramms besteht, untersucht. Eine Übertragbarkeit der genetischen Effekte, die in einem Zuchtzyklus geschätzt wurden und zur Vorhersage der genotypischen Werte im nachfolgenden Zuchtzyklus verwendet werden, ist für hoch heritable Merkmale, wie z.B. Zuckergehalt, Erfolg versprechend. Für die Vorhersage von genotypischen Werten war die Ridge-Regression, welche vorläufige Schätzer der Heritabilität verwendet (RIR), die schnellste Methode unter den Methoden, die homoskedastische Markervarianzen annehmen.

Präzise Schätzungen des wahren genetischen Effekts von jedem Marker sind ein wichtiges Kriterium für heteroskedastische genomweite Vorhersagemodelle, wenn sie für die Identifikation funktioneller Gene für Genintrogression oder für die Vorhersage von Kreuzungsleistungen verwendet werden. Eine Modifikation des Expectation-Maximization-Algorithmus, welche zu heteroskedastischen Markervarianzen führt (RMLV), und Ridge-Regression mit Gewichtungsfaktoren in Abhängigkeit von der Varianzkomponentenanalyse (RRWA) sind Alternativen zu den Bayes´schen Methoden. RRWA hat die übrigen untersuchten Methoden zur genomweiten Vorhersage mit heteroskedastischen Markervarianzen in Bezug auf rechnerische Effizienz übertroffen. Die präzisesten Markereffekte in einem simulierten Datensatz wurden mit RMLV geschätzt, insbesondere wenn sich lange Abschnitte entlang der Chromosomen im Gametenphasenungleichgewicht befanden und die Markerdichte hoch war. Dies kommt sehr häufig in Pflanzenzüchtungsprogrammen vor.

Die vorgeschlagenen neuartigen Ridge-Regressions Methoden sind vielversprechend, sie erzielen präzise Vorhersagen von genotypischen Werten, präzise Markereffektschätzer und sind zudem rechnerisch effizient.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand