https://frosthead.com

Sprachbarrieren küssen Auf Wiedersehen

Der Universalübersetzer war lange Zeit eine Obsession der Popkultur. Star Trek präsentiert es als Handheld-Gerät, das einem Mikrofon ähnelt und die meisten Sprachen sofort übersetzen kann . Der Per Anhalter durch die Galaxis zeigt einen Babel-Fisch, eine Kreatur, die, wenn sie im Ohr steckt, eine sofortige Übersetzung jeder Sprache in der Galaxis bietet.

Kein Wunder also, dass heutige Menschen versuchen, ein Gerät zu entwickeln, das genauso gut funktioniert. Es gibt Dutzende Übersetzungs-Apps für Smartphones, aber die meisten übersetzen Wörter auf einer einfachen Eins-zu-Eins-Basis. Ein Benutzer gibt ein Wort ein oder spricht ein Wort und die App springt mit einer Übersetzung zurück. Jetzt ist es das Ziel und der eigentliche finanzielle Gewinn, dass Ingenieure und Unternehmer es zwei Personen ermöglichen, sich in verschiedenen Sprachen zu unterhalten, während ein kleines Gerät Übersetzungen in Echtzeit ausgibt.

Bestehende Übersetzungs-Apps

Auf einer Reise nach Griechenland wurde der englischsprachige Andrew Lauder krank.

„Ich bin in die Apotheke gegangen und sie konnten kein Englisch, also habe ich keine Medikamente bekommen“, sagt Lauder, CEO von Vocre Translate. Die Medikamentenetiketten waren für ihn im wahrsten Sinne des Wortes griechisch. Sprachbarrieren sind bei Weltreisenden weit verbreitet. Im Ausland werden kleine Transaktionen wie der Kauf von Medikamenten oder die Beschaffung von Anweisungen - eine weitere Schwierigkeit, mit der Lauder konfrontiert ist - zu Herkulesaufgaben.

Bei seiner Rückkehr nach Amerika entwickelte Lauder Vocre Translate, eine Sprach- und Textübersetzungs-App. Es begann als Text-zu-Text-App (MyLangauge) und wurde zunächst in ein Sprach-zu-Text-Modell umgewandelt, das wie andere Apps, einschließlich SayHi Translate, ein traditionelles Modell verwendete, bei dem ein Wort direkt in ein anderes Wort übersetzt wird. Sagen Sie „Hallo“, und das Smartphone oder Tablet gibt ein automatisiertes „Hola“ zurück. Aus „Auf Wiedersehen“ wird „Sayonara“. Und so weiter, ähnlich wie bei einem Textübersetzer.

Um die einfache Audio-Übersetzung zu erstellen, benötigten die Ersteller dieser Apps Daten. Vocre bezog seine Informationen aus gemeinfreien Aufzeichnungen und Dokumenten wie alten Filmen oder öffentlichen Anhörungen. "Wir haben im Grunde genommen einen Voicemail-Transkriptionsdienst angefordert, damit wir ihre Cloud für die Spracherkennung verwenden können", sagt Lee Bossier, CEO von SayHi.

Sobald die Ingenieure Audio- und Textdaten hatten, paarten sie Audio und Text Wort für Wort. Spracherkennungssoftware erkennt „Käse“ und wandelt ihn in Text um. Das ist in Französisch konvertiert und die App findet die französische Aussprache für "fromage".

Das heißt, wenn ein Benutzer etwas „kitschig“ nennt, funktioniert der Übersetzer nicht so gut, weil die gesprochene Sprache nicht annähernd so statisch ist wie die geschriebene Sprache. Kadenz, Umgangssprache, Flexion, Aussprache, Dialekt und Gesprächsfluss können die Bedeutung ändern

Mit der Zeit wollte Lauder jedoch ein Gesprächsgerät. In einer E-Mail sagt er: „Aufgrund unserer Nutzungsdaten haben wir festgestellt, dass die Leute ganz anders sprechen als sie schreiben. Das gesprochene Wort ist viel spontaner und viel weniger formal und wörtlich. “Daher verwendete er die statistische maschinelle Übersetzung, ein Ansatz, der auch von Google verwendet wird, um anhand von Daten die gebräuchliche Wortverwendung zu finden, und verzichtete auf das traditionelle Wort-zu-Wort-Übersetzungsmodell. Grundsätzlich lernt Vocre so, wie es gebraucht wird. „Es lernt basierend auf jedem Gespräch, jeder Phrase, die es durchläuft. Es ist etwas, das mit der Zeit schlauer wird “, sagt Lauder.

Derzeit benötigen beide Apps noch einige Sekunden für die Übersetzung, sind jedoch insbesondere in Verbindung mit der Körpersprache für Transaktionsgespräche wie das Bestellen einer Mahlzeit zweifellos effektiv. Immerhin bestellen Menschen seit Jahren Lebensmittel in nicht-einheimischen Sprachen und schaffen es immer noch zu essen. Sie waren jedoch nicht in der Lage, eingehende und komplexe Gespräche zu führen.

Mit Vocre und SayHi können die Unterhaltungen sehr unterschiedlich sein, aber es ist nicht dasselbe wie in Ihrer Muttersprache zu chatten. Google beabsichtigt, dies vollständig zu ändern.

Googles Ansatz (Statistische maschinelle Übersetzung)

Wenn wir in der Schule eine neue Sprache lernen, beginnen wir mit individuellen Vokabeln. Aber die Sprache ist flüssiger - Wörter brauchen Kontext.

"Der Ansatz von [Google] ist allgemeiner", sagt Josh Estelle, Softwareentwickler bei Google Translate. "Anstatt zu versuchen, alle diese Regeln fest zu codieren, versuchen wir, die Regeln anhand von Daten zu lernen."

Das Technologieunternehmen vermeidet die Eins-zu-eins-Wort-für-Wort-Methode und verwendet stattdessen eine statistische maschinelle Übersetzung. Dabei wird nicht untersucht, was Wörter bedeuten, sondern wie die Sprache modelliert wird, die es anhand von Daten lernt . Es zielt also auf den Wald ab, nicht auf die Bäume. Ein englisches Beispiel: Wir kennen die Definitionen der Wörter "break" und "up". Der Ausdruck "break up" ist jedoch nicht die wörtliche Kombination der beiden Wörter.

Für die statistische maschinelle Übersetzung sind Daten erforderlich. Berge davon. Damit die Methode funktioniert, muss nicht nur „Fromage“ für Käse französisch sein, sondern es müssen auch 100 Beispiele für „Fromage“ und Käse in tatsächlichen Sätzen verwendet werden.

Estelle sagt, wenn ein englischer Sprecher zwei Menüs hat, die identisch sind, abgesehen von der Tatsache, dass eines auf Englisch und eines auf Chinesisch gedruckt ist. "Sie können wahrscheinlich herausfinden, was das chinesische Schriftzeichen für" Suppe "ist." Der Kontext ist König. Um diesen Kontext zu erstellen, benötigen Sie Zugriff auf Millionen von Menüs und jedes andere vorstellbare Dokument.

Welches ist genau das, was Google hat. Ohne den Webgiganten, der jede Menge Daten sammeln könnte, könnte es keinen echten Babel-Fisch geben. Es durchsucht das Web und sammelt alles - Text und Audio. Dann werden diese Daten in Algorithmen eingespeist, die alles mit allem anderen vergleichen. Diese Vergleiche helfen dabei, die Wurzel der natürlichen Funktionsweise der Sprache zu finden.

"Eine Sache, die die Leute überrascht, wenn wir über Übersetzen sprechen, ist, dass unser Team keine Linguisten hat", sagt Estelle. „Wir haben 71 Sprachen eingeführt, und ich würde sagen, unser Team kann die überwiegende Mehrheit von ihnen nicht sprechen. Ein menschlicher Übersetzer wird nicht in der Lage sein, all diese Begriffe und Dinge so schnell zu lernen, wie unsere [Daten] aus dem Web lernen können. “

Was ist der Sinn?

Facebook sieht wie Google Vorteile. Betrachten Sie den eigenen Vorstoß der Social-Media-Site zur Übersetzung.

„Die Mission von Facebook besteht darin, die ganze Welt zu verbinden, und eines der Hindernisse für die Verbindung der Welt ist, dass nicht jeder dieselbe Sprache spricht“, sagt Tom Stocky, Director of Engineering bei Facebook. "Auf der Übersetzungsseite denke ich, dass die ehrgeizige Vision für die Zukunft darin besteht, Facebook in Ihrer Muttersprache zu verwenden und mit jeder anderen Sprache zu interagieren."

Im vergangenen August erwarb Facebook Jibbigo, eine App für die Übersetzung von Sprache zu Sprache, die für Android- und iOS-Geräte verfügbar ist.

Interessierte Facebook-Nutzer werden feststellen, dass die soziale Website bereits einige Übersetzungen enthält. Wenn Sie jemals einen spanischen Beitrag auf Ihrer englischsprachigen Seite veröffentlicht haben, haben Sie sofort die Möglichkeit, diesen in Ihre Muttersprache zu übersetzen.

Aber Stocky sieht die Sprachkomponente als potenziellen Game Changer. Der Aufstieg von Smartphones und Tablets begrüßt eine ständig miteinander verbundene Welt, und der Aufstieg der Spracherkennungssoftware lädt zu neuen Möglichkeiten der Webinteraktion ein. Stocky stellt sich eine Zukunft vor, in der Benutzer nur einen Befehl mit ihrem Smartphone sprechen und mit anderen Benutzern interagieren können, abgesehen von Sprachunterschieden.

"Es ist keine Frage, die irgendwann passieren wird, denn die einzigen Einschränkungen sind die Leistung der Sprach-Engine und natürlich die Verarbeitungszeit und -leistung", sagt er.

Laura Murphy, Professorin für globale Gesundheitssysteme und -entwicklung an der Tulane University und anerkannte Technologieskeptikerin, hinterfragt den Wert eines universellen Übersetzers, der nicht mehr als eine Sprache sprechen muss.

Sie ist der Meinung, dass das Gerät für Reisen, geschäftliche und internationale Beziehungen nützlich sein könnte, aber nicht bahnbrechend. Ab einem bestimmten Grad haben wir bereits Übersetzer (Leute), und die meisten, die in den Auslandsbeziehungen arbeiten, kennen die entsprechenden Sprachen. Ein Gerät, glaubt Murphy, könnte negative Konsequenzen haben.

"Ich denke, es kann die Leute faul machen", sagt Murphy. Das Übersetzen von Sprachen kann eine mentale Herausforderung sein, indem das Gehirn - insbesondere eines, das mehr als zwei Sprachen beherrscht - gezwungen wird, anders zu arbeiten, aber die Übung lohnt sich trotzdem. Das Gehirn zieht aus einem Ort des sprachlichen Einfühlungsvermögens, den selbst der beste Sprachübersetzer niemals erreichen könnte.

Während diese universelle Kommunikation positiv sein könnte, räumt Murphy ein, "könnte dies dazu führen, dass die Leute denken, sie kommunizieren, wenn sie nicht sind." Kultur ist nicht immer vollständig in der Sprache verankert (nehmen Sie zum Beispiel Sarkasmus), und Kommunikation nicht immer über die Informationen, die weitergegeben werden.

Wann können wir mit dieser Technologie rechnen?

"Im Jahr 2005 haben wir 40 Stunden gebraucht, um 1.000 Sätze zu übersetzen", sagt Estelle von Google. "Heute übersetzen wir alle 10 Millisekunden das Äquivalent von 1.000 Sätzen."

Wie Richard Anderson in der Fernsehserie The Six Million Dollar Man ( The Six Million Dollar Man) aus den 1970er Jahren bekannt gab: „Wir haben die Technologie.“ Jetzt geht es nur noch darum, auf das Sammeln und Analysieren von Daten zu warten. Wie lange das dauern wird, ist laut Estelle unbekannt. Aber vorsichtige Schätzungen legen ein solches Gerät innerhalb eines Jahrzehnts in unsere Hände.

Während App-Macher wie Bossier oder große Unternehmen wie Google und Facebook keine eigenen Versionen des Biblischen Turms von Babel bauen möchten, möchten sie dem Geschwätz ein Ende setzen. Es stellt sich eine Welt vor, in der wir alle kommunizieren, über Medizin, über Politik, über Ideen.

Und diese Welt ist vielleicht nicht weit weg.

Anmerkung des Herausgebers: Wir haben diese Geschichte am 4. April 2014 aktualisiert, um die Vocre Translate-Technologie genau zu beschreiben.

Sprachbarrieren küssen Auf Wiedersehen