Korpuslinguistik und allgemeine Informationen über korpuslinguistische Fragestellungen
Plan
Korpuslinguistik und ihr Gegenstand
Das Ziel von Korpuslinguistik
Korpuslinguistische Fragestellungen
Die Korpuslinguistik ist ein Bereich der Sprachwissenschaft. Darin werden neue Erkenntnisse über Sprache generell oder über bestimmte einzelne Sprachen erlangt oder bestehende Hypothesen überprüft, wobei als Grundlage quantitative oder qualitative Daten dienen, die aus der Analyse von speziellen Textkorpora oder (seltener) Korpora gesprochener Sprache gewonnen werden. Große Verbreitung fand die Korpuslinguistik im deutschsprachigen Raum ab der zweiten Hälfte der 1990er Jahre. Sie steht wissenschaftstheoretisch betrachtet, dem Generativismus entgegen. Es ist nach wie vor umstritten, ob es sich bei der Korpuslinguistik um eine Methode oder um einen eigenen neuen Zweig der Sprachwissenschaft handelt. Gegenstand der Korpuslinguistik ist die Sprache in ihren verschiedenen Erscheinungsformen. Die Korpuslinguistik ist dabei durch das Verwenden von authentischen Sprachdaten charakterisiert, die in großen Korpora dokumentiert sind. Bei solchen Textkorpora handelt es sich um Sammlungen von sprachlichen Äußerungen, die nach bestimmten Kriterien und mit einem bestimmten Forschungsziel zusammengestellt werden. Die Erkenntnisse der Korpuslinguistik basieren somit auf natürlichen Äußerungen einer Sprache, also auf Sprache, wie sie tatsächlich verwendet wird. Diese Äußerungen können entweder schriftlich entstanden sein oder es kann sich um spontane oder elizitierte gesprochene Sprache handeln. Die meisten Korpora liegen heute in digitaler Form vor und sind mittels bestimmter Software für die linguistische Recherche nutzbar.
2. Ziel der Korpuslinguistik ist es, anhand dieser Daten entweder bestehende linguistische Hypothesen zu überprüfen (bestätigen oder widerlegen) oder durch explorative Datenanalyse neue Hypothesen und Theorien über den Gegenstand zu gewinnen. Man spricht im ersten Fall von „korpusgestützter“ linguistischer Analyse und im zweiten Fall von „korpusbasierter“ linguistischer Analyse. Korpuslinguistische Fragestellungen betreffen sowohl das sprachliche System selbst als auch den Gebrauch von Sprache. Die Korpuslinguistik ist also dahingehend im Begriff, die in der Linguistik dominierende dichotome Sprachbetrachtung aufzuheben.
3. Die Inputfaktoren Häufigkeit, Salienz, Komplexität und Kontext werfen für die jeweiligen sprachlichen Ebenen im Spannungsfeld zwischen Muttersprache(n) und Zielsprache(n), zwischen Perzeption und Produktion sowie zwischen bewussten und unbewussten Prozessen eine Reihe von Forschungsfragen auf, die mit korpuslinguistischen Methoden beantwortet werden können. Häufigkeit als Inputfaktor spielt auf allen sprachlichen Ebenen eine große Rolle. Wenn Spracherwerb auch ein intuitives statistisches Lernproblem ist, ist Häufigkeit einer der zentralen Faktoren im Spracherwerb. Häufigkeit lässt sich leicht mit korpuslinguistischen Methoden ermitteln. Für den Kontext DaF ist wichtig, dass Häufigkeit aus einer Inputperspektive gesehen wird. Das heißt z. B., dass nicht allgemeine Häufigkeit – über alle Textsorten hinweg – das sprachliche System des Lerners weiterentwickelt, sondern Häufigkeit im Input, den der Lerner erhält. Dabei ist es sicherlich nötig, zwischen visuellem (schriftlichem) und auditivem (mündlichem) Input zu unterscheiden (vgl. Tschirner 2003). Es ist unklar, wie sich visuelle und auditive sprachliche Repräsentationen gegenseitig beeinflussen. Es scheint jedoch ratsam zu sein, sich im Fremdsprachenunterricht zumindest im Grundstufenbereich nicht zu sehr auf Transferprozesse vom Visuellen zum Auditiven zu verlassen, sondern bei der Entwicklung mündlicher Kompetenzen mit auditivem Input zu arbeiten und bei der Entwicklung schriftlicher Kompetenzen mit visuellem Input. Im Fortgeschrittenenbereich verknüpfen sich dann beide auf komplexe Art, vgl. auch das Konzept der „Textkompetenz“ (vgl. etwa Portmann-Tselikas/Schmölzer-Eibinger 2002). Input für die Entwicklung mündlicher Kompetenzen (Hören und Sprechen) muss also zunächst vor allem als gehörter Input verstanden werden, als gesprochene Sprache, worunter natürlich – zumindest auf weiter fortgeschrittenen Sprachniveaus – auch vorgelesene Sprache fallen kann. Es geht hier also zunächst nicht so sehr generell um konzeptuell mündliche Sprache, zu der man auch SMS- und Chat-Kommunikation zählen könnte, sondern um auditiv vernommene und verarbeitete Sprache. Damit sind Korpora der (medial) gesprochenen Sprache von ausschlaggebendem Interesse, wobei hier die Organisation derartiger Korpora einen Zugriff nach Diskurs- bzw. Gesprächstypen ebenso ermöglichen muss wie nach bestimmten pragmatischen, situativen und rollenspezifischen Faktoren.
Do'stlaringiz bilan baham: |