Das Land Mordor? Wie Hacker und Spione Google Translate verwenden

Jan 14 2016
Google führte einige wenig schmeichelhafte Änderungen in der russischen Übersetzung einer ukrainischen Zeitung auf Maschinenfehler zurück. Aber einige Sicherheitsexperten sagen, dass das unmöglich ist.
Pro-russische Sympathisanten, die eine russische Flagge tragen, marschieren an pro-ukrainischen Sympathisanten vorbei, die sich am 8. März 2014 in Simferopol, Ukraine, versammelten und ukrainische Flaggen schwenkten. Sean Gallup/Getty Images

Google Translate ist eine Art Wunder. Geben Sie einen beliebigen Satz in das Feld ein und erhalten Sie sofort eine verdammt genaue Übersetzung in mehr als 90 verschiedene Sprachen, von Afrikaans bis Zulu. Der kostenlose Dienst von Google kann auch ganze Dokumente oder Websites übersetzen, und seine Smartphone-App kann auf Fotos aufgenommene Wörter entziffern und sogar Zwei-Wege-Gespräche in Echtzeit übersetzen.

Die ukrainische Zeitung Ukrainska Pravda hat so viel Vertrauen in Google Translate, dass sie den Dienst nutzt, um eine russischsprachige Online-Ausgabe der Zeitung zu veröffentlichen. Die Übersetzungen sind normalerweise genau richtig, weshalb die russischsprachigen Leser letzte Woche überrascht (und ein wenig angewidert) waren, „Russland“ als „Mordor“ übersetzt zu finden – der Sitz des Bösen in JRR Tolkiens „Herr der Ringe“ – und Russlands Außenminister Sergej Lawrow als „trauriges Pferdchen“ dargestellt.

Die Ukraine bleibt nach der Annexion der Krim durch Russland im Jahr 2014 eine Brutstätte politischer Unruhen . Obwohl die bewaffneten Auseinandersetzungen aufgehört haben, gibt es immer noch keine Liebe zwischen pro-ukrainischen Aktivisten und pro-russischen Separatisten. Die von Google übersetzte Version der Ukrainska Pravda gab das Wort „Russisch“ auch als „Besatzer“ wieder.

Die provokativen Fehlübersetzungen dauerten einen Tag, bevor Google das Problem behob, das ein Sprecher als normale technische Panne bezeichnete . Einige Sicherheitsexperten glauben jedoch, dass die "Mordor"-Anspielungen und andere politische Stiche unmöglich das Ergebnis eines Computerfehlers sein könnten. Google Translate wurde eindeutig gehackt. Aber wie?

Um das Geheimnis zu lüften, sprach HSW mit Michael Shoukry, einem Cybersicherheits- und Geheimdienstexperten bei FireEye , einem internationalen Unternehmen, das sich auf die Identifizierung und Neutralisierung ausgeklügelter Cybersicherheitsbedrohungen spezialisiert hat.

Shoukry glaubt Googles Behauptung nicht, dass die „Mordor“-Übersetzungen aus der normalen Dummheit des maschinellen Lernens resultieren – wenn Computer versuchen, Verbindungen zwischen Millionen von Textschnipseln online herzustellen, und gelegentlich falsch liegen.

„Ich denke nicht, dass dies ein Fehler ist, denn diese Worte haben für die Menschen eine Bedeutung. Sie zeigen Absicht“, sagt Shoukry. „Ein Computer könnte sich diese Dinge nicht selbst ausdenken.“ 

Loren ipsum und All That Latin

Shoukry weiß ein oder zwei Dinge über das Hacken von Google Translate. Er verbrachte ein Jahr damit, eine frühere Kuriosität in Google Translate zu recherchieren, bei der es um den allgegenwärtigen lateinischen Platzhaltertext namens Lorem ipsum ging . Auf den Hinweis eines anonymen Sicherheitsforschers namens „Kraeh3n“ hin gab Shoukry lateinische Wörter und Sätze in Google Translate ein, die bizarre und faszinierende Ergebnisse lieferten :

lorem ipsum“ = China

ipsum lorem“ = das Internet

Lorem Ipsum“ = NATO

Ipsum Lorem“ = das Unternehmen (ein gebräuchlicher Spitzname für die CIA)

Genau wie bei dem russischen „Mordor“-Vorfall war Shoukrys Bauchgefühl, dass die Lorem- Ipsum - Übersetzungen kein Zufall sein konnten. Sie roch nach Kryptographie, den verschlüsselten Nachrichten, die von Regierungsspionen, politischen Aktivisten und anderen verdeckten Gruppen verschickt wurden, die versuchten, heimlich vor aller Augen zu kommunizieren.

„In der Forschungs- und Geheimdienstgemeinschaft ist es etwas, das jeder kennt“, sagt Shoukry. „Die Leute versuchen die ganze Zeit, geheime Botschaften zu übermitteln.“

Der Lorem-Ipsum- Hack war brillant in seiner Einfachheit. Es nahm einen Teil des bereits vorhandenen Textes – in diesem Fall eine Reihe lateinischer Wörter, die alle Webdesigner und Herausgeber verwenden, um „Dummy“-Layouts zu erstellen – und verwandelte ihn in einen kryptographischen „Schlüssel“.

„Sie müssen nicht einmal irgendwelche Inhalte senden“, um eine verschlüsselte Nachricht weiterzuleiten, sagt Shoukry. „Ich kann Ihnen einfach sagen, gehen Sie zu Vorlage fünf, Seite drei, Absatz vier, Wort 42, und wiederholen Sie es dann 142 Mal, und Sie haben Ihre geheime Botschaft. Ich könnte Ihnen einfach eine Reihe von Nummern schicken.“

Wie Google Übersetzer funktioniert

Google Translate ist ein erstaunliches technisches Tool, aber es ist anfällig für menschliche Eingriffe.

Aber wie genau könnte ein Hacker Google Translate dazu verleiten, für jedes lateinische Wort die richtige „falsche“ Übersetzung zu liefern? Indem Sie sich als hilfreiches Mitglied der Google Übersetzer-Community ausgeben .

Der größte Teil der Schwerarbeit von Google Translate wird von Supercomputern geleistet, die den ganzen Tag damit verbringen, Millionen von Webseiten zu analysieren, um Muster zwischen übersetzten Textblöcken zu finden. Das nennt man statistisches maschinelles Lernen , und während die Computer von Google sicherlich eher Fehler mit Latein machen – weil es im Internet relativ wenig lateinischen Text gibt – sagt Shoukry, dass das eigentliche Problem ein menschliches ist.

„Eine der Missionen von Google ist es, von seinen Nutzern zu lernen, und als Teil davon möchte Google wirklich tief graben und die Linguistik verstehen“, sagt Shoukry. Google Translate ist ein cooler Dienst für die Öffentlichkeit, aber es ist auch eine Möglichkeit für die Computer von Google, ihre Sprachkenntnisse zu verfeinern, um bessere Suchergebnisse zu liefern.

Hier kommt die Google Übersetzer-Community ins Spiel. Google lädt mehrsprachige Nutzer ein, dabei zu helfen, Wörter und Sätze in ihre Muttersprache zu übersetzen. Sie können den Text entweder selbst übersetzen oder die Übersetzungen anderer Personen validieren. In beiden Fällen ermöglicht Google den Nutzern, die Leistung seiner eigenen Supercomputer zu „prüfen“. Es lässt auch Hackern eine Tür offen.

„Google verlässt sich stark auf Endnutzer und Inhalte, die online veröffentlicht werden“, erklärt Shoukry. „Also kann jede Sprache geändert werden, weil Google sich auf Informationen verlässt, die möglicherweise nicht wahr sind.“

Um es klar zu sagen, eine Handvoll Witzbolde wäre nicht in der Lage, das System auszutricksen, indem sie wiederholt die falschen Übersetzungen eingeben. Eine Täuschung in der Größenordnung des Lorem-Ipsum- Hacks oder des russischen „Mordor“-Vorfalls erfordert „eine beträchtliche Menge an Computerleistung“ und technische Raffinesse, sagt Shoukry.

Google hat die Lorem-Ipsum- Lücke inzwischen „gefixt“ , indem es sich geweigert hat, den Text überhaupt zu übersetzen. Aber solange Google Translate normalen Benutzern die Möglichkeit gibt, von Hand zu übersetzen und zu validieren, gibt es Raum für „Fehler“, ob absichtlich oder nicht. 

Jetzt ist das cool

Google-Ingenieure haben Sinn für Humor. Bis vor kurzem konnten Sie Google Translate durch Eingabe von unsinnigem Text zu einer „Beatbox“ machen . Weitere Informationen finden Sie in einer Liste der besten Google-Ostereier .