WIE GPS LERNT, IHRE SPRACHE ZU SPRECHEN INNOVATION | SMITHSONIAN - ARTIKEL, INNOVATION, TECHNOLOGIE, MAGAZIN

Karen Jacobsen, eine australische Sängerin und Synchronsprecherin, bekam den Auftritt im Jahr 2000, kurz nachdem sie in New York angekommen war. Die Produzenten - Unternehmenstypen - schickten sie für drei Wochen in ein Aufnahmestudio, wo sie vier Stunden am Tag Dinge sagte wie „an der nächsten Kreuzung links abbiegen“ und „neu berechnen“. Am Ende war es nicht ihre Stimme das war angespannt. „Ich habe ungefähr 186 Mal‚ ungefähr 'gesagt “, erinnert sich Jacobsen. "So etwas kann dich verrückt machen."

Verwandte Inhalte

Von Ptolemäus zu GPS, die kurze Geschichte der Karten

Zwei Jahre später erhielt sie einen Anruf von einer Freundin. "Karen", platzte ihr Kumpel heraus. „Ich habe meinem Mann eines dieser neuen GPS-Geräte gekauft und wir haben es auf die australische Stimme gestellt. Du bist es! “So erfuhr Jacobsen, dass ihre Stimme 400 Millionen Menschen auf der ganzen Welt Anweisungen gab.

Ihre Arbeit hebt die Mischung aus Blut und Technologie hervor, die in die mittlerweile allgegenwärtigen Stimmen eingeht, die uns sagen, wohin wir uns wenden sollen: Mehr als eine Milliarde Menschen verlassen sich jeden Monat auf Google Maps, und 80 Prozent aktivieren die Sprachoption.

In den frühen Tagen der Sprachsynthese - denken Sie an die Roboterklänge eines Speak & Spell aus den späten 1970er Jahren - wandelte ein Algorithmus Text in einen monotonen Stream um. Dann, als die Datenbanken wuchsen, konnten Sie einen Synchronsprecher wie Jacobsen aufnehmen, der ein Korpus von Silben und Wörtern aussprach, die Algorithmen kombinierten und nach Grundregeln änderten. In jüngerer Zeit haben Software-Codierer bei Unternehmen wie Nuance, die Navigationsschnittstellen für Autos entwickeln, einen dritten Ansatz entwickelt - das Anwenden von Deep Learning auf die Sprachsynthese. Es mischt aufgezeichnete Wörter und synthetisierte Schnipsel und stützt sich dabei auf künstliche Intelligenz, um die Aussprache noch menschlicher zu gestalten. "Sie klingen unheimlich natürlich", sagt Nuance-Technologiechef Vlad Sejnoha.

Sprachmängel bleiben natürlich eine Herausforderung für Sprachsysteme. "Denken Sie" Ast "gegen" gekauft "oder" lesen "gegen" lesen "", sagt ein Google-Sprecher. "Aber hoffentlich kann der Benutzer immer erraten, was wir gemeint haben." Nun, da AI Autonavigationssystemen beibringt, intelligenter zu sprechen, durchsucht es die Online-Welt und findet heraus, wohin Sie wollen, noch bevor Sie es tun.