Dr. Konstanze Marx (Berlin): "Das Web als Korpus für linguistische Analysen – Möglichkeiten und Grenzen"
Eröffnungsvortrag auf dem IV. Workshop zur linguistischen Internetforschung, 1. Mai 2015, Leibniz Universität Hannover)
Für Sprachwissenschaftler generiert sich mit dem World Wide Web (WWW) sekündlich ein geradezu unerschöpflicher Datenpool. Das Textmaterial ist vielgestaltig: Mannigfache Textsorten werden von den unterschiedlichsten Schreibern produziert, rezipiert und kommentiert. Der Zugang zu diesen Daten ist denkbar einfach, weshalb man sich kaum des Eindrucks erwehren kann, ein WWWeldorado vorgefunden zu haben, aus dessen Quellen man nur zu schöpfen brauche. In der Tat, hat das Web als Korpus Potenziale, die ich im Vortrag skizzieren werde. Unweigerlich stößt man bei diesen Betrachtungen jedoch auch an Grenzen, die benannt und diskutiert werden sollen. Dazu gehören praktische Fragen, wie z.B. die nach der Archivierung großer multimodaler Datenmengen, aber auch rechtliche, wie z.B. die Frage, ob Statusmeldungen von Sozialen-‐Netzwerk-‐Seiten kopiert und als Korpus zur Verfügung gestellt werden dürfen.