KI übersetzt indigene Sprachen – Mexikos digitale Revolution [Mexiko]

Wie bringt man einem Computer eine Sprache bei, die nie geschrieben wurde? Eine Sprache, die nur von wenigen tausend Menschen gesprochen wird, deren Grammatik sich grundlegend vom Spanischen unterscheidet und für die es keine Wörterbücher, keine Lehrbücher, keine digitalen Texte gibt? Diese Frage stellen sich Forscher in Mexiko seit einigen Jahren – und sie finden erstaunliche Antworten. Von der Purépecha-Sprache in Michoacán bis zum Tsotsil in Chiapas entstehen Projekte, die Künstliche Intelligenz nutzen, um indigene Sprachen zu bewahren, zu übersetzen und für neue Generationen zugänglich zu machen. Es ist ein Wettlauf gegen die Zeit – und gegen das digitale Vergessen.

[Wusstest du? In Mexiko werden 68 indigene Sprachen gesprochen, unterteilt in 364 Varianten. Viele von ihnen haben nur noch wenige tausend Sprecher, und ohne digitale Präsenz droht ihnen das endgültige Verschwinden. KI kann helfen, sie zu bewahren – aber nur, wenn die Gemeinschaften selbst die Kontrolle behalten.]

Als die KI Purépecha lernte

Die Purépecha-Sprache, gesprochen von etwa 120.000 Menschen im Bundesstaat Michoacán, galt lange als technologisch unzugänglich. Zu komplex die Grammatik, zu gering die Datenmenge, zu groß die Unterschiede zum Spanischen. Ein Forscherteam der Universidad Nacional Autónoma de México (UNAM) ließ sich davon nicht abschrecken. Unter der Leitung von Dr. Christian Maldonado-Sifuentes und seiner Studentin Cecilia González-Servín entwickelten sie einen speziellen Übersetzer für Purépecha – mit bemerkenswertem Erfolg (LinkedIn 2024).

Das Problem: Neuronale Maschinenübersetzung (NMT) braucht riesige Datenmengen. Für Purépecha gab es die nicht. Also halfen die Forscher mit einem Trick nach: Sie nutzten große Sprachmodelle, um aus Grammatikregeln und wenigen Beispielen synthetische Daten zu generieren. Das Ergebnis übertraf alle Erwartungen. Während das Modell, das nur mit echten Daten trainiert wurde, einen BLEU-Wert von 28,6 erreichte (eine gängige Messgröße für Übersetzungsqualität), kam das mit synthetischen Daten vortrainierte Modell auf 34,68 – ein neuer Bestwert für Purépecha-Übersetzungen (ACM Digital Library 2025).

*[Wusstest du? BLEU-Werte über 30 gelten als verständliche Übersetzung. Der Wert von 34,68 bedeutet, dass die KI Purépecha in einer Qualität übersetzt, die von Muttersprachlern verstanden werden kann.]*

Wenn die Community die Kontrolle behält

Parallel zu den akademischen Forschungen wächst in Mexiko eine Bewegung von unten. Im März 2025 trafen sich 47 Aktivistinnen und Aktivisten aus mehr als 20 indigenen Sprachgemeinschaften in Mexiko-Stadt zum ersten „AI+Indigenous Languages Forum“. Sie alle arbeiten an digitalen Projekten für ihre Sprachen – und sie alle haben eine gemeinsame Sorge: Wer kontrolliert die Daten? Wer profitiert von der KI? Und wie verhindert man, dass die Technologie die kulturelle Vielfalt nicht bewahrt, sondern vereinheitlicht? (Global Voices 2025).

Katia González, eine der Teilnehmerinnen, brachte es auf den Punkt: „Ein Teil der ökologischen Verantwortung ist es, die Auswirkungen zu hinterfragen, die unsere Gemeinschaften haben, um die Motoren kühl zu halten.“ (Global Voices 2025). Die Aktivistinnen fordern nicht weniger als digitale Souveränität: Datenhoheit, Mitspracherecht und Schutz vor kultureller Vereinnahmung durch große Tech-Konzerne.

Verónica Aguilar warnte vor versteckten Gefahren: „Woher nimmt die KI ihre Daten? Aus dem, was bereits existiert. Und das ist vieles, was im letzten Jahrhundert gefördert wurde – sehr folklorisierend. Die Geschichte der Indigenen auf dem Land, dass wir alle gut sind. Von dort bezieht die KI ihre Informationen. Aus linguistischer Sicht mag das positiv sein, aber bei den Werten, die vermittelt werden, werden wir nicht zustimmen, denn für uns ist es nicht nur eine Frage der Sprache, sondern der gesamten Kultur.“ (Global Voices 2025).

Tsotsil lernen mit KI

Während in Mexiko-Stadt diskutiert wird, wird im Bundesstaat Chiapas bereits praktisch gearbeitet. Die Escuela de Humanidades y Educación (EHE) des Tecnológico de Monterrey entwickelt in Zusammenarbeit mit der Regierung von Chiapas eine KI-gestützte Lernplattform für Tsotsil, eine Maya-Sprache mit über 550.000 Sprechern (INVDES 2025).

Das System kann mehr als nur übersetzen. Es transkribiert gesprochene Sprache in Text, wandelt Text in gesprochene Sprache mit nativem Akzent um und arbeitet komplett offline – eine entscheidende Voraussetzung in Regionen ohne stabile Internetverbindung. „Das Ziel ist, dass diese Plattform einen Prozess der doppelten Alphabetisierung begleitet“, erklärt Projektleiter Alejandro Martín del Campo. „Wir wollen, dass Menschen in verschiedenen Ortschaften die Möglichkeit haben, ihr Tsotsil zu stärken, zu perfektionieren oder wiederzuerlernen – und gleichzeitig Spanisch zu lernen, um sich in beiden Sprachen fließend verständigen zu können.“ (INVDES 2025).

[Wusstest du? In Chiapas haben 28,2 Prozent der Bevölkerung eine indigene Sprache als Muttersprache. Gleichzeitig ist der Staat der mit der höchsten Analphabetenrate Mexikos – 11,5 Prozent der Erwachsenen können nicht lesen und schreiben. Die neue Plattform soll beides adressieren: Sprachbewahrung und Alphabetisierung.]

Die Frau, die Náhuatl rettete

Gabriela Salas, eine der Forscherinnen im Tsotsil-Projekt, hat bereits Erfahrung mit dieser Art von Arbeit. Drei Jahre lang entwickelte sie einen KI-Übersetzer für Náhuatl, die Sprache der Azteken, die noch von über 1,5 Millionen Menschen gesprochen wird. 2023 wurde ihr Projekt von Google Translate übernommen – eine der wenigen indigenen Sprachen weltweit, die in dem Tool vertreten sind (NotiPress 2025).

Jetzt steht sie vor einer neuen Herausforderung. „Tsotsil ist schwieriger als Náhuatl, weil es nicht der Logik des Spanischen folgt“, erklärt sie. „Es ist eine agglutinierende Sprache mit Maya-Wurzeln, die Strukturen sind komplex. Alles muss mit Muttersprachlern validiert werden, bevor das Modell trainiert wird.“ (INVDES 2025).

Bisher hat das Team etwa 17.000 Sätze und 20.000 einzelne Wörter gesammelt. Das Ziel: 21.000 validierte Sätze, die sowohl grammatikalisch als auch kulturell korrekt sind. Dann erst kann die KI lernen.

Sprachhüter im digitalen Zeitalter

Eine entscheidende Rolle spielen die sogenannten „Sprachhüter“ (guardianes de la lengua) – Muttersprachler, die die gesammelten Daten überprüfen, Varianten korrigieren, Orthografie vereinheitlichen und vor allem: sicherstellen, dass die Digitalisierung nicht zu kulturellem Extraktivismus verkommt (NotiPress 2025). Sie sind die Brücke zwischen uraltem Wissen und modernster Technologie.

Das Projekt des Tecnológico de Monterrey ist eingebettet in das Programm „Chiapas Puede“, eine Initiative der Landesregierung zur Alphabetisierung und sozialen Entwicklung. „Oft nutzen wir Technologie in den großen Städten“, sagt Martín del Campo, „aber wenn man sie in einem viel gemeinschaftlicheren und sozialeren Kontext einsetzt, versteht man erst ihren wahren Impact.“ (INVDES 2025).

Ein Modell für die Welt

Was in Mexiko entsteht, könnte Vorbild für andere Regionen werden. Von den Mayasprachen Guatemalas bis zu den indigenen Sprachen Perus und Boliviens – überall kämpfen Gemeinschaften um den Erhalt ihrer sprachlichen Identität. Die Kombination aus akademischer Forschung, technologischer Innovation und vor allem: der Kontrolle durch die Gemeinschaften selbst, könnte der Schlüssel sein.

Cecilia González-Servín, die junge Forscherin, die den Purépecha-Übersetzer mitentwickelte, fasst ihre Motivation so zusammen: „Es geht nicht nur um Technologie. Es geht um Würde. Wenn unsere Sprachen im digitalen Raum sichtbar sind, sind auch wir sichtbar.“ (LinkedIn 2024).


Quellen:

guteideenblog.org sollte ein interner Link sein. guteideenblog.org © 2025 by Gute Ideen ist lizenziert unter CC BY 4.0. Kurz erklärt: Nutze alles und verlinke auf diesen Artikel.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert