Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP)

Band 8:
Schneider, Roman: Mehrfach annotierte Textkorpora. Strukturierte Speicherung und Abfrage. 315 S. - Tübingen: Narr, 2019.
ISBN: 978-3-8233-8286-7, Preis: 78,40 €

Dieser Band ist im IDS verfügbar:

[Buch] IDS-Bibliothek: Sig. ME 2001
Alternatives Medium:
E-Book (PDF). Tübingen: Narr. ISBN: 978-3-8233-9286-6, Preis: 78,40 €

Digitale Korpora haben die Voraussetzungen, unter denen sich Wissenschaftler mit der Erforschung von Sprachphänomenen beschäftigen, fundamental verändert. Umfangreiche Sammlungen geschriebener und gesprochener Sprache bilden mittlerweile die empirische Basis für mathematisch präzise Generalisierungen über zu beschreibende Wirklichkeitsausschnitte. Das Datenmaterial ist hochkomplex und besteht neben den Rohtexten aus diversen linguistischen Annotationsebenen sowie außersprachlichen Metadaten. Als unmittelbare Folge stellt sich die Konzeption adäquater Recherchelösungen als beträchtliche Herausforderung dar. Im vorliegenden Buch wird deshalb ein datenbankbasierter Ansatz vorgestellt, der sich der Problematiken multidimensionaler Korpusrecherchen annimmt. Ausgehend von einer Charakterisierung der Anforderungsmerkmale linguistisch motivierter Suchen werden Speicherungs- und Abfragestrategien für mehrfach annotierte Korpora entwickelt und anhand eines linguistischen Anforderungskatalogs evaluiert. Ein Schwerpunkt liegt dabei in der Einführung problemorientierter Segmentierung und Parallelisierung.

Inhaltsverzeichnis

mehr anzeigen
1.   Einführung und Motivation S. 9
2.   Linguistische Anforderungen an Sprachkorpora S. 23
3.   Design und Implementierung eines Korpusabfragesystems S. 101
4.   Evaluation des Anforderungskatalogs S. 177
5.   Versuch einer Laufzeitoptimierung durch segmentierte Abfragen S. 217
6.   Integration in ein Online-Framework S. 275
7.   Zusammenfassung und Fazit S. 285
 
Literatur S. 291