Giessener Elektronische Bibliothek

GEB - Giessener Elektronische Bibliothek

Hypertextsorten : Definition, Struktur, Klassifikation

Hypertext Types : definition, structure, classification

Rehm, Georg


Zum Volltext im pdf-Format: Dokument 1.pdf (24.081 KB)


Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:hebis:26-opus-26887
URL: http://geb.uni-giessen.de/geb/volltexte/2006/2688/


Freie Schlagwörter (Deutsch): Computerlinguistik , Linguistik , Hypertext , Semantic Web
Freie Schlagwörter (Englisch): Computational Linguistics , Hypertext , Web Genre , Semantic Web
Universität Justus-Liebig-Universit├Ąt Gie├čen
Institut: Institut f├╝r Germanistik - Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik
Fachgebiet: Germanistik
DDC-Sachgruppe: Sprachwissenschaft, Linguistik
Dokumentart: Dissertation
Sprache: Deutsch
Tag der m├╝ndlichen Pr├╝fung: 22.01.2006
Erstellungsjahr: 2005
Publikationsdatum: 26.01.2006
Kurzfassung auf Deutsch: Suchmaschinen im WWW indexieren und durchsuchen Dokumente in gro├čer Geschwindigkeit. Trotz der quantitativ beeindruckenden Ergebnisse l├Ąsst die
Qualit├Ąt der Treffer jedoch oft zu w├╝nschen ├╝brig. Die vorliegende Arbeit
zielt darauf ab, die theoretischen und praktischen Grundlagen f├╝r strukturelle Verbesserungen der Funktionsweise von Suchmaschinen zu liefern. Der Schl├╝ssel hierf├╝r liegt in der maschinellen Identifikation von Hypertextsorten. Dieser Begriff bezeichnet den generellen Typ eines WWW-basierten Hypertextes im Sinne eines funktional-thematisch markierten Kommunikats. Hypertextsorten sind -- ebenso wie traditionelle Textsorten -- auf verschiedenen Ebenen von Konventionen gekennzeichnet, die rekurrent in zugeh├Ârigen Text- bzw. Hypertextexemplaren beobachtet werden k├Ânnen. Eine Komponente zur maschinellen Erkennung von Hypertextsorten k├Ânnte unter anderem im Rahmen einer Suchmaschine Verwendung finden. Ihren Anwendern st├╝nde hierdurch eine weitere Ebene des Zugriffs auf Dokumente zur Verf├╝gung, so dass nach Dokumenten recherchiert werden kann, die die angegebenen Stichw├Ârter enthalten und dar├╝ber hinaus den vom Benutzer spezifizierten Hypertextsorten zugeh├Ârig sind, z.B. pers├Ânliche Homepage, Produktkatalog oder Kochrezept (Kap. 1).


Die Arbeit behandelt zun├Ąchst die f├╝r die Charakterisierung des Begriffs Hypertextsorte ben├Âtigten Grundlagen (Teil I), die sich auf die Textlinguistik (Kap. 2) und die linguistischen Spezifika des Konzepts Hypertext st├╝tzen (Kap. 3). Anschlie├čend werden die Kerneigenschaften von Hypertextsorten dargestellt (Kap. 4). Teil II erl├Ąutert den Rahmenansatz und die Methodologie. In Kap. 5 wird ein Hypertextsortenmodell entwickelt, das sowohl f├╝r textlinguistische Analysen als auch f├╝r texttechnologische Anwendungen ausgelegt ist und zwischen den drei konzeptionellen Ebenen Hypertextsorte, Hypertextknotensorte und Hypertextsortenmodul differenziert. Kap. 6 stellt die Untersuchungsdom├Ąne der universit├Ąren Webangebote vor, f├╝r die ein Korpus von etwa vier Millionen HTML-Dokumenten angefertigt wurde, die sich in einer Korpusdatenbank befinden und sowohl manuell -- ├╝ber eine Web-Oberfl├Ąche -- als auch automatisch analysiert werden k├Ânnen (Kap. 7). Teil III umfasst f├╝nf empirische Analysen als exemplarische Anwendungen des Hypertextsortenmodells. Die ersten drei Analysen betreffen die quantitative Auswertung pers├Ânlicher Homepages (Kap. 8) und Untersuchungen von Exemplaren der Hypertextsorten private Homepage eines Studierenden (Kap. 9) sowie pers├Ânliche Homepage eines Wissenschaftlers (Kap. 10). In Kap. 11 wird die Hypertextknotensorte Einstiegsseite eines universit├Ąren Webauftritts anhand von 35 Einstiegsseiten analysiert; es schlie├čt sich eine Untersuchung der 692 Dokumente an, die mittels Hyperlinks referenziert werden. In der f├╝nften Analyse werden 750 zuf├Ąllig ausgew├Ąhlte Dokumente ausgewertet (Kap. 12). Mit den beiden abschlie├čenden Untersuchungen wird das Ziel der Sammlung und Identifizierung von Hypertextknotensorten und Hypertextsorten verfolgt. Die Analysen weisen eine Vielzahl von Konventionen nach und belegen die Existenz zahlreicher Hypertextsorten, die nicht nur dem universit├Ąren Bereich zuzurechnen sind. Teil IV geht auf die technologische
Umsetzung ein. Kap. 13 pr├Ąsentiert die Hypertextsortenontologie, die auf der Web Ontology Language basiert und von einem Dom├Ąnenmodell sowie einer
Ontologie wissenschaftlicher Themen und Fachgebiete flankiert wird. In diese Ontologie werden die Ergebnisse der empirischen Analysen integriert, wobei auch die Frage der Typologisierung aufgegriffen wird. Die maschinelle
Identifizierung von Hypertextsorten als Grundlage sprachtechnologischer
Anwendungen ist Gegenstand von Kap. 14. Ausgehend von einer kritischen
Betrachtung der vorliegenden Arbeiten zur automatischen Identifizierung von
Web-Genres wird eine Architektur mit Komponenten entwickelt, die f├╝r die
maschinelle Erkennung von Hypertextsorten ben├Âtigt werden, um die im WWW
existenten realen Gegebenheiten der Kommunikation erfassen zu k├Ânnen. Die
Hypertextsortenontologie fungiert hierbei als Wissensbasis, die die
Zusammenh├Ąnge zwischen Hypertextsorten, Hypertextknotensorten und
Hypertextsortenmodulen beinhaltet. Es wird die prototypische Implementierung eines Textparsers f├╝r arbitr├Ąre HTML-Dokumente vorgestellt, der innerhalb dieser Architektur einen zentralen Stellenwert einnimmt, um die Komponenten der Textoberfl├Ąche auf Hypertextsortenmodule abzubilden.
Lizenz: Veröffentlichungsvertrag für Publikationen ohne Print on Demand