Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Korpus-basierte effiziente Informationsextraktion und Grammatikinduktion der natürlichen Sprachen

Corpus-based efficient information extraction and grammar induction of the natural languages

Shen, Chunze


Zum Volltext im pdf-Format: Dokument 1.pdf (3.938 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-99257
URL: http://geb.uni-giessen.de/geb/volltexte/2013/9925/

Bookmark bei Connotea Bookmark bei del.icio.us


Freie Schlagwörter (Deutsch): korpusbasiert , effizient , Grammatik-InduKtion , lokale Grammatiken
Universität Justus-Liebig-Universität Gießen
Institut: Angewandte Sprachwissenschaft und Computerlinguistik
Fachgebiet: Sprache, Literatur, Kultur fachübergreifend
DDC-Sachgruppe: Sprachwissenschaft, Linguistik
Dokumentart: Dissertation
Sprache: Deutsch
Tag der mündlichen Prüfung: 11.07.2013
Erstellungsjahr: 2013
Publikationsdatum: 22.07.2013
Kurzfassung auf Deutsch: Grammatik-Induktion gewinnt aufgrund ihrer vielseitigen Anwendungen seit einigen Jahren immer mehr Aufmerksamkeit. In der Computerlinguistik ist die automatische Grammatik-Induktion heute ein hochinteressantes Forschungsthema geworden. In der vorliegenden Arbeit wurde ein effizienter lernbasierter Ansatz (EDSI) entwickelt, kontextfreie Grammatiken automatisch zu extrahieren und darüber hinaus lokale Grammatiken zu induzieren. Der EDSI-Ansatz (Effiziente Distillation syntaktischer Informationen) wurde auf englischen und deutschen Korpora evaluiert und mit den klassischen Ansatz ABL verglichen. Die Verarbeitungseffizienz wird wesentlich erhöht, während die Extraktionsresultate auch verbessert werden. Am Ende werden lokale Grammatiken beispielsweise angewendet, um spezielle Informationen zu extrahieren.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand