KI-Übersetzung bewahrt bedrohte Sprachen in Papua-Neuguinea

Der Morgen beginnt mit Stimmen. Kinder rufen einander über staubige Wege zu, irgendwo klappert Geschirr, ein Radio spielt leise Musik. In einem Dorf im Hochland von Papua-Neuguinea mischen sich mehrere Sprachen in der Luft. Ein Gespräch auf Tok Pisin, ein anderes in einer lokalen Sprache, deren Namen viele Menschen außerhalb der Region noch nie gehört haben.

Papua-Neuguinea gilt als das sprachlich vielfältigste Land der Erde. Über 800 Sprachen werden hier gesprochen – ein globaler Rekord. Doch viele davon verschwinden langsam. Junge Menschen wechseln zu größeren Verkehrssprachen, während ältere Sprecher sterben. Linguisten schätzen, dass ein erheblicher Teil dieser Sprachen innerhalb weniger Generationen verloren gehen könnte (Lewis et al. 2023).

In den letzten Jahren taucht jedoch ein unerwarteter Verbündeter auf: künstliche Intelligenz.

Sprachliche Vielfalt am Rand des Verschwindens

Viele der Sprachen Papua-Neuguineas haben nur wenige tausend oder sogar nur wenige hundert Sprecher. Schriftliche Traditionen fehlen oft. Wissen wird mündlich weitergegeben: Geschichten, medizinisches Wissen, Lieder, genealogische Erzählungen.

Das Problem beginnt im Alltag. Schulen unterrichten meist auf Englisch oder Tok Pisin. Behörden verwenden ebenfalls diese Sprachen. Für junge Menschen bedeutet das: Wer Bildung und Arbeit sucht, braucht größere Sprachen.

Der Linguist und Anthropologe Steven Bird beschäftigt sich seit Jahren mit diesem Problem. An der University of Melbourne arbeitet er an Projekten, die maschinelles Lernen für Sprachschutz einsetzen. Seine Idee: Technologie nicht als Ersatz, sondern als Werkzeug für Gemeinschaften.

Ein zentrales Problem ist die Dokumentation. Für viele Sprachen existieren kaum Wörterbücher oder Textsammlungen. Ohne Daten können auch digitale Übersetzungssysteme kaum arbeiten.

Hier beginnt ein neuer Ansatz.

Digitale Werkzeuge für kleine Sprachen

Ein Projekt namens Papuan Languages Initiative nutzt maschinelles Lernen, um Sprachdaten effizient zu sammeln und zu verarbeiten. Dorfbewohner nehmen Gespräche oder Geschichten mit Smartphones auf. Die Aufnahmen werden anschließend transkribiert und in Datenbanken gespeichert.

KI-Modelle können dann Muster erkennen: häufige Wörter, grammatische Strukturen, Übersetzungsäquivalente. Schritt für Schritt entstehen digitale Wörterbücher und Übersetzungshilfen.

Der Ansatz unterscheidet sich bewusst von klassischen Linguistikprojekten. Früher sammelten Forscher Material und veröffentlichten später wissenschaftliche Arbeiten. Jetzt stehen lokale Gemeinschaften stärker im Mittelpunkt.

Ein Beispiel kommt aus einer Region im Nordosten des Landes. Dort arbeiteten Forscher mit Dorfbewohnern zusammen, um Geschichten älterer Sprecher aufzunehmen. Innerhalb weniger Monate entstanden hunderte Stunden Sprachmaterial – mehr als in manchen Jahrzehnten traditioneller Feldforschung.

Ein kleines Detail zeigt den Unterschied: Viele der Aufnahmen entstanden nicht in Interviews, sondern bei Alltagsaktivitäten. Beim Fischen, beim Kochen oder während Dorffesten.

So bleiben Sprache und Kontext verbunden.

Lokale Gemeinschaften als Träger des Projekts

Technologie allein rettet keine Sprache. Das betonen viele Beteiligte. Entscheidend ist, dass Menschen ihre Sprache weiterhin sprechen.

Ein Lehrer aus der Provinz Madang erzählte Forschern beispielsweise, dass Schüler plötzlich neugierig auf ihre eigene Sprache wurden, nachdem sie eine digitale Wörterliste auf einem Tablet sahen. Ein vertrauter Dialekt erschien plötzlich auf dem Bildschirm – etwas, das zuvor nur mündlich existierte.

Solche Momente sind klein, aber bedeutsam.

Digitale Werkzeuge ermöglichen außerdem neue Bildungsformate. In einigen Pilotprojekten werden zweisprachige Lernmaterialien erstellt: lokale Sprache und Tok Pisin oder Englisch. Dadurch können Kinder Lesen lernen, ohne ihre Muttersprache aufzugeben.

Forscher beobachten zudem einen weiteren Effekt. Wenn Sprachen digital dokumentiert sind, steigt oft das Prestige innerhalb der Gemeinschaft. Sie gelten nicht mehr als „Dialekt des Dorfes“, sondern als Teil des kulturellen Erbes.

Langfristig könnten solche Datenbanken auch automatische Übersetzungssysteme ermöglichen – etwa zwischen lokalen Sprachen und Tok Pisin.

Noch steht diese Technologie am Anfang. Doch erste Ergebnisse zeigen, dass maschinelles Lernen auch mit kleinen Datensätzen arbeiten kann, wenn lokale Sprecher aktiv beteiligt sind.

Kulturelles Wissen im digitalen Archiv

Mit jeder aufgenommenen Geschichte wird mehr bewahrt als nur Sprache.

Viele Erzählungen enthalten traditionelles Wissen über Pflanzen, Heilmethoden oder Jagdtechniken. In manchen Regionen existieren detaillierte Beschreibungen von Ökosystemen, die in wissenschaftlichen Studien kaum dokumentiert sind.

Wenn eine Sprache verschwindet, geht häufig auch dieses Wissen verloren.

Digitale Archive können zumindest einen Teil davon sichern. Sie ermöglichen Forschern, Lehrern und Gemeinschaften Zugang zu Material, das früher nur lokal verfügbar war.

Für die Bewohner vieler Dörfer ist das Projekt deshalb mehr als ein technisches Experiment. Es ist eine Möglichkeit, kulturelle Identität sichtbar zu machen.

Ein älterer Sprecher aus dem Hochland formulierte es einmal sinngemäß so: Wenn unsere Sprache verschwindet, verschwindet auch unsere Geschichte.

Künstliche Intelligenz kann diesen Verlust nicht vollständig verhindern. Aber sie kann helfen, Stimmen zu bewahren, die sonst vielleicht nie aufgezeichnet worden wären.


Quellen

Lewis, M. P., Simons, G. F., Fennig, C. D. (2023): Ethnologue: Languages of the World.
https://www.ethnologue.com

Bird, S. (2020): Decolonising speech and language technology. Proceedings of COLING.
https://aclanthology.org/2020.coling-main.35

University of Melbourne (2022): Papuan Languages Initiative.
https://www.unimelb.edu.au

UNESCO (2021): World Atlas of Languages.
https://en.unesco.org/watlas



guteideen.org © 2025 by Gute Ideen ist lizenziert unter CC BY 4.0. Kurz erklärt: Nutze alles und verlinke auf diesen Artikel.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert