Millionen Menschen wollen eine Fremdsprache lernen: Sie plagen sich mit Übungen, Aufgaben, Tests – und das alles muss dann jemand korrigieren. Unsere Computerlinguisten hatten eine Idee, wie der gewaltige Einsatz von Schülern und Lehrern das Sprachenlernen verbessern und der Forschung dienen kann.
Nicht, dass es in diesem Fall ein Expertenurteil bräuchte, aber es tut doch ganz gut, so etwas von Linguisten zu hören: „Wie Sprachenlernen heute abläuft – atemberaubend ist das nicht“, sagt Lionel Nicolas von Eurac Research, und seine Kollegin Verena Lyding fügt hinzu: „Die meisten von uns wissen aus eigener Erfahrung, dass das ziemlich langweilig sein kann. Zwar geht der Trend seit ein paar Jahren zum Digitalen, aber der Ansatz bleibt dabei oft schulbuchhaft und steif.“ Und dann kommt doch auch noch der wissenschaftliche Blickwinkel ins Spiel: Obwohl längst erwiesen sei, dass Erfolg beim Sprachenlernen stark davon abhängt, wie die Art der Vermittlung und die Voraussetzungen des Schülers zusammenpassen (die Muttersprache etwa spielt eine große Rolle, aber auch, welcher Lerntyp jemand ist), würden immer noch alle mit den gleichen Übungen, Erläuterungen und Beispielen gefüttert. „One size fits all. Und trotzdem:“ – Nicolas wirkt, als würde ihn das selbst erstaunen – „Die Leute lassen sich nicht entmutigen! Sie wollen Sprachen lernen. Allein in Europa dutzende Millionen. Für uns ist das die perfekte Situation.“
Perfekt, weil immenses Potenzial darin steckt, wie die beiden Forscher erkannten. Denn was, so fragten sie sich, wenn all die Zeit und Energie, die Sprachschüler in das Erlernen des passato remoto stecken, in die Feinheiten französischer Konjunktivkonstruktionen oder auch nur in die Hoffnung, im nächsten Urlaub in fehlerlosem Spanisch eine paella con mariscos bestellen zu können – was, wenn dieser gewaltige Aufwand dem wissenschaftlichem Fortschritt dienstbar gemacht werden könnte? Und wenn dabei auch noch der Sprachunterricht selbst beständig besser würde? Völlig kostenfrei?
Lyding und Nicolas sahen eine Möglichkeit, all dies Wirklichkeit werden zu lassen. „Im Grunde erkannten wir nur einen hochaktuellen Trend und fügten verschiedene Themen, an denen in der Wissenschaft gerade gearbeitet wird, zu einem Ganzen zusammen“, erklärt Nicolas. Und so nahm ein Vorhaben Form an, das mittlerweile, gefördert von der EU, schon 70 Forscher aus 30 Ländern vereint und „in seinem Potenzial vergleichbar ist mit Wikipedia“, wie es im dem Projektantrag für Brüssel heißt. Zu erklären ist es ein wenig komplizierter als die Webenzyklopädie. In aller Kürze geht es darum, Online-Sprachenlernen mit Crowdsourcing-Techniken zu verbinden – also mit dem Einbeziehen von Internetnutzern zur Lösung kleiner Teilaufgaben.
Die Methode hat in der Wissenschaft längst Fuß gefasst: Astronomen lassen Laien Mondkrater zählen, Biomediziner Proteinstrukturen entschlüsseln. Manchmal leistet die crowd (Menschenmenge) dabei ihren Beitrag ganz bewusst, gibt aus Freude an der Sache ihre Kenntnisse weiter oder erledigt Fleißarbeit, manchmal spielen die Netznutzer aber auch einfach ein Computerspiel, und der versteckte Zweck für die Wissenschaft interessiert sie nicht sonderlich; gemeinsam ist allen diesen Initiativen, dass sie die Möglichkeiten des digitalen Zeitalters ausschöpfen, um die „Weisheit der Vielen“ für die Forschungsarbeit einzuspannen. „Das ist das Faszinierende daran“, sagt Lyding. „Damit kann man sehr ehrgeizige Ziele erreichen. In unserem Fall zum Beispiel müssen die Sprachlerner nichts tun, was sie nicht ohnehin tun würden. Aber ihre Aktivitäten werden für die Forschung wertvoll, weil man sie systematisch zusammenführen und in großem Stil auswerten kann.“
Die Infrastruktur dafür: eine digitale Lernplattform. Über sie sollen die unterschiedlichsten Menschen kostenlos Sprachen lernen, während hinter den Kulissen Forscher, Firmen oder andere Interessierte die Arbeit der Lehrer und Lernenden crowdsourcen um Schwierigkeiten, Fehler, Fortschritte auszuwerten – und dabei auch etwas zu lernen: nämlich wie unterschiedliche Menschen Sprachen lernen. Welche Fehler machen etwa Franzosen im Englischen besonders häufig? Was sind die Probleme von Japanern mit der deutschen Wortstellung? Anhand der so gewonnenen Erkenntnisse, kann das Lernmaterial dann an verschiedenste Lernerprofile angepasst werden. Vorbei die Zeiten, in denen alle das gleiche Programm absolvieren, selbst wenn es nur für zehn Prozent das optimale ist. Jeder erhält, womit er am besten und schnellsten lernt, der afghanische Flüchtling ebenso wie der schwedische Erasmusstudent. „Man kann sich das vorstellen wie bei Amazon, wenn man nach einem Buchkauf weitere Empfehlungen bekommt“, erklärt Nicolas. „Lerner mit deinem Profil und Kenntnisstand zogen großen Nutzen aus diesen Übungen.“ Im Fremdsprachenunterricht werde eine Revolution stattfinden, sind die Forscher überzeugt. Und sie kommt gerade recht in einer Zeit, in der die halbe Welt auf Wanderschaft ist und die Zielgruppen für Sprachunterricht immer vielfältiger werden.
So aufregend diese Aussichten sind, sie sind nicht das einzige, was Nicolas und Lyding mit dem Vorhaben erreichen wollen. Ihr Fachgebiet ist nämlich nicht Fremdsprachenlernen, sondern Computerlinguistik, auch Natural Language Processing (NLP) genannt: ein seit Jahren boomendes Feld, das sich mit der Verarbeitung menschlicher Sprache durch den Computer befasst. NLP steckt in Übersetzungs- und Korrekturprogrammen, automatischer Textzusammenfassung, Eigennamenerkennung, Suchmaschinen – in vielen Anwendungen, die längst Teil unseres Alltags sind und die, wie Nicolas seufzend erklärt „viel, viel besser funktionieren könnten, verfügten wir nur über unbegrenzte Arbeitskraft“. Was den Fortschritt hemmt, ist ein Problem von Zeit und Kosten. Denn für den Computer heißt mit Sprache umgehen natürlich rechnen, doch damit die ganze Mathematik zu zufriedenstellenden Ergebnissen führt, braucht die Maschine möglichst viel kodifizierte Information über die Sprache. Noch klaffen da aber leider Lücken (je nach Sprache unterschiedlich große; aber auch kleine Leerstellen können den Rechner ganz schön durcheinanderbringen). Und diese Lücken zu füllen – zum Beispiel jedes Wort in seinen verschiedenen Formen und allen Möglichkeiten seiner Anwendung in einer Datenbank auszubuchstabieren – erfordert einen gewaltigen und da Sprache sich ständig entwickelt nie endenden Arbeitsaufwand, den Forschungseinrichtungen nicht bezahlen können. Weil die tatsächliche Arbeit der Computerlinguisten aber auf dieser Vorleistung fußt, ist es für die Forscher von großer Bedeutung, sie möglichst günstig zu bekommen (Nicolas hat der möglichst effizienten Beschaffung von Datensätzen seine Doktorarbeit gewidmet).
Und nun will man diese Aufgabe also schrittweise an Sprachenlerner übertragen. Wie es funktioniert, erklärt Nicolas an einem einfachen Beispiel. Nehmen wir an, ein neues Wort taucht im Sprachgebrauch auf. Derzeit muss ein Experte es für den Computer beschreiben, zum Beispiel festhalten, dass es sich um ein Verb handelt. Mit dem gleichen Ziel könnte das Wort aber auch in eine Sprachübung einfließen – etwa in eine Liste von Worten, unter denen die Schüler die Verben erkennen müssen. Ob der einzelne richtig liegt, spielt dabei keine große Rolle: Der Computer errechnet, wie viele Schüler welchen Niveaus sich einig sein müssen, damit ihre Antwort so vertrauenswürdig ist, wie das Urteil des Experten, den man eingespart hat.
Das klingt kompliziert, aber tatsächlich haben die meisten von uns über eine ähnliche Methode schon mit kleinen Verrichtungen im Netz einer größeren Errungenschaft gedient. Oder wer hat noch nie eine verzerrte Buchstabenfolge entschlüsselt, um zu beweisen, dass es ein Mensch ist, der sich hier einloggen will, kein Computer? Seit etwa zehn Jahren sind diese Textschnipsel auf vielen Websites Auszüge aus alten Dokumenten, die digitalisiert werden sollen, bei denen optische Texterkennungsprogramme aber nicht weiter kommen. Auch die hier genutzte Software reCAPTCHA erreicht Genauigkeit durch das Abgleichen vieler Antworten. Auf diesem Weg haben Millionen von Internetnutzern schon geholfen, ganze Zeitungsarchive und Bibliotheken für die Zukunft zu bewahren – ohne Bezahlung und meist ohne davon zu wissen.
Noch viel weitreichendere Folgen könnte es haben, wenn Sprachlerner künftig nebenher Daten für die computerlinguistische Forschung produzieren. Nach dem, was in anderen Wissenschaftsfeldern zu beobachten war, etwa der Gentechnologie, lassen dramatisch sinkende Kosten nämlich eine Innovationsexplosion erwarten. Noch steht man aber erst ganz am Anfang: Nächsten Monat treffen sich 70 europäische Forscher zum ersten Mal in Brüssel. Vier Jahre werden sie dann intensiv zusammenarbeiten – für eine Zukunft, in der Menschen leichter Fremdsprachen lernen und, wie Lyding es ausdrückt, „in Sprachbelangen neue Horizonte erreicht werden“: zum Beispiel, dass der Computer sehr viel besser unsere Sprachen spricht.