Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Ebenen des Themas : Zur Interaktion von Thema, Text und Wissen

Bärenfänger, Maja


Zum Volltext im pdf-Format: Dokument 1.pdf (4.112 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-89242
URL: http://geb.uni-giessen.de/geb/volltexte/2012/8924/

Bookmark bei del.icio.us


Freie Schlagwörter (Deutsch): Textlinguistik , Computerlinguistik , Thema , Themenidentifikation , Topic Extraction
CCS - Klassifikation: H.3.1 , I.2.7
Universität Justus-Liebig-Universität Gießen
Institut: Institut für Germanistik, Arbeitsbereich Angewandte Sprachwissenschaft und Computerlinguistik
Fachgebiet: Germanistik
DDC-Sachgruppe: Sprachwissenschaft, Linguistik
Dokumentart: Dissertation
Sprache: Deutsch
Tag der mündlichen Prüfung: 01.03.2011
Erstellungsjahr: 2011
Publikationsdatum: 28.08.2012
Kurzfassung auf Deutsch: Die Dissertation „Ebenen des Themas. Zur Interaktion von Thema, Text und Wissen“ beschäftigt sich mit einem Kernkonzept der Textlinguistik, dem Thema. Dieses Konzept wird einerseits in einer Fülle von linguistischen Aufsätzen – allerdings nur einer einzigen Monographie – zumindest am Rande behandelt, andererseits besteht bislang weder ein Konsens über die Definition des Themas noch über seine Analyse. Die vorliegende Arbeit setzt an diesem Punkt an und entwickelt unter Einbeziehung der bestehenden sehr heterogenen Satz- und Textthema-Konzepte ein integratives Thema-Modell, das den Ausgangspunkt für ein Modell zur Operationalisierung der Analyse des Themas im Text bildet. Dabei wird aufgezeigt, welche Analyseschritte mittels welcher computerlinguistischen Verfahren automatisiert werden können, welche Ressourcen für eine „Verrechnung“ der Analysen der einzelnen Ebenen nötig und bereits verfügbar sind und wie die Architektur eines auf den theoretischen Überlegungen der vorliegenden Arbeit basierenden Softwaresystems zur maschinellen Themenidentifikation aussehen könnte.
Die Entwicklung des integrativen Thema-Konzepts basiert auf einer Neubewertung bisheriger Forschungsansätze. Dabei wird gezeigt, dass die meisten der linguistischen Thema-Konzepte keineswegs konkurrierende und einander ausschließende Thema-Auffassungen darstellen, sondern dass sie lediglich verschiedene Perspektiven auf das Thema widerspiegeln, d.h. als einander ergänzende Auffassungen interpretiert werden können. Auf Basis eines Multi-Ebenen-Modells des Textes, das in den größeren Kontext von Kommunikation und Kognition eingebettet wird, wird dargestellt, wie die verschiedenen Ebenen des Themas und die verschiedenen Wissensbestände im Prozess der Kommunikation (Textproduktion und -rezeption) interagieren.
Die Diskussion der linguistischen Thema-Forschung wird ergänzt durch die der computerlinguistischen Forschungsansätze zur maschinellen Themenidentifikation. Dabei wird gezeigt, dass diese nahezu immer ein Theoriedefizit im Hinblick auf die ihnen zugrunde liegende Thema-Konzeption aufweisen. Dieses Defizit ist mit dafür verantwortlich, dass zwischen den meisten Ansätzen zur Themenidentifikation und zur Keyword- bzw. Schlüsselwort-Identifikation de facto kein großer Unterschied besteht.
An die theoretische Klärung und Modellentwicklung schließt sich die Entwicklung einer Architektur und die Beschreibung und Evaluation der Komponenten eines Software-Systems zur maschinellen Themenidentifikation an. In diesem Zusammenhang werden einerseits die Wissensbestände, die für die Analyse des Themas nötig sind, erörtert und auf existierende oder in der Entwicklung befindliche computerlinguistische Ressourcen bezogen. Andererseits wird dargestellt, in welcher Weise die verschiedenen Beschreibungsebenen des Textes selbst (Informationsstruktur, lexikalische, anaphorische, relationale, visuelle, logische sowie generische Texttypstruktur) Aufschluss über das Thema geben, d.h. das Thema reflektieren oder durch indexikalische Zeichen auf das Thema verweisen. Für jede Beschreibungsebene wird schließlich beschrieben und anhand eines Beispieltextes illustriert, welche bereits implementierten computerlinguistischen Verfahren zur maschinellen Analyse des Themas auf der jeweiligen Ebene eingesetzt werden können.
Damit wurden mit der vorliegenden Arbeit zwei Desiderate erfüllt: Zum einen wurde ein Thema-Konzept entwickelt, das die bisherigen, sehr vielfältigen linguistischen Thema-Konzepte in ein komplexes Erklärungsmodell zu integrieren erlaubt. Zum anderen wurde ein Analysemodell für das Thema präsentiert, das eine Operationalisierung der Themenanalyse ermöglicht und als Grundlage für computerlinguistische Arbeiten zur maschinellen Themenidentifikation geeignet ist und dabei eine eindeutige Differenzierung der Themenidentifikation von der Keyword-Identifikation ermöglicht.

Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand