https://frosthead.com

Können Computer eine 5.000 Jahre alte Sprache entschlüsseln?

Die Indus-Zivilisation, die während eines Großteils des dritten Jahrtausends v. Chr. Blühte, war die umfangreichste Gesellschaft ihrer Zeit. Auf seiner Höhe umfasste es eine Fläche von mehr als einer halben Million Quadratkilometern an der heutigen indisch-pakistanischen Grenze. Überreste des Indus wurden im Norden bis zum Himalaya und im Süden bis nach Mumbai gefunden. Es war die früheste bekannte Stadtkultur des Subkontinents und hatte zwei große Städte, eine in Harappa und eine in Mohenjo-daro. Trotz seiner Größe und Langlebigkeit und trotz fast hundertjähriger archäologischer Untersuchungen bleibt vieles über den Indus im Dunkeln.

Was wir noch nicht wissen, stammt aus archäologischen Ausgrabungen, die in den 1920er Jahren begannen und bis heute andauern. Im Laufe der Jahrzehnte haben Archäologen eine Vielzahl von Artefakten entdeckt, darunter Siegelstempel, Amulette und kleine Täfelchen. Viele dieser Artefakte tragen scheinbar Schriftstücke - gravierte Figuren, die unter anderem geflügelten Hufeisen, Speichenrädern und aufrecht stehenden Fischen ähneln. Was genau diese Symbole bedeuten könnten, bleibt jedoch eines der bekanntesten ungelösten Rätsel in der Wissenschaft der alten Zivilisationen.

Es gab andere schwierige Codes in der Geschichte. Mit der Entdeckung des berühmten Rosetta-Steins im Jahr 1799, der sowohl ägyptische als auch griechische Texte enthielt, hatten ratlose Ägyptologen einen glücklichen Bruch. Das Studium der Maya-Hieroglyphen brach aus, bis ein russischer Linguist namens Yury Knorozov in den 1950er Jahren die zeitgenössischen gesprochenen Maya geschickt einsetzte. Aber es gibt keinen Rosettastein des Indus, und die Gelehrten wissen nicht, welche Sprache, wenn überhaupt, von der Sprache des Indus abstammt.

Vor ungefähr 22 Jahren blätterte in Hyderabad, Indien, ein Schüler der achten Klasse namens Rajesh Rao in einem Geschichtsbuch und erfuhr zuerst von dieser faszinierenden Zivilisation und ihrer mysteriösen Schrift. In den folgenden Jahren gingen seine Ausbildung und sein Beruf in eine andere Richtung - er absolvierte ein Informatikstudium, das er heute an der University of Washington in Seattle unterrichtet -, aber er überwachte die Indus-Wissenschaft sorgfältig und verfolgte Dutzende gescheiterter Studenten Versuche, das Drehbuch zu verstehen. Rao studierte gerade künstliche Intelligenz und Robotik und sammelte eine kleine Sammlung von Büchern und Monographien über die Indus-Schrift, etwa 30 davon. Auf einem nahe gelegenen Bücherregal verwahrte er auch das geschätzte Geschichtsbuch der achten Klasse, das ihn mit dem Indus bekannt machte.

"Es war einfach unglaublich, wie viele verschiedene Ideen vorgeschlagen wurden", sagt er. Einige Gelehrte behaupteten, das Schreiben sei eine Art sumerische Schrift. andere stellten es in der dravidischen Familie auf; Wieder andere dachten, es sei mit einer Sprache der Osterinsel verwandt. Rao erkannte, dass dies "wahrscheinlich eines der schwierigsten Probleme in Bezug auf die alte Geschichte" war.

Als ein Versuch nach dem anderen fehlschlug, das Skript zu entschlüsseln, verloren einige Experten die Hoffnung, dass es entschlüsselt werden könnte. Im Jahr 2004 argumentierten drei Wissenschaftler in einem kontroversen Artikel, dass die Indus-Symbole überhaupt keinen sprachlichen Inhalt hätten. Stattdessen waren die Symbole möglicherweise nur Piktogramme, die politische oder religiöse Persönlichkeiten darstellten. Die Autoren gingen so weit, zu behaupten, dass der Indus überhaupt keine gebildete Zivilisation sei. Für einige auf dem Gebiet begann die ganze Suche nach der Sprache hinter diesen Indus-Radierungen wie eine Übung der Sinnlosigkeit.

Einige Jahre später trat Rao in den Kampf ein. Bis dahin waren die Autoren Archäologen, Historiker, Linguisten oder Kryptologen. Aber Rao beschloss, die Geheimnisse des Indus-Skripts mit dem Tool, das er am besten kannte - der Informatik - zu entlocken.

Rajesh Rao, der seit der achten Klasse von der Indus-Zivilisation fasziniert ist, verwendet Informatik und ein Konzept namens "bedingte Entropie", um das Indus-Skript zu entschlüsseln. (Mit freundlicher Genehmigung von David Zax) Im Laufe der Jahrzehnte haben Archäologen eine Vielzahl von Artefakten aus der Indus-Zivilisation entdeckt, darunter Briefmarkensiegel, Amulette und kleine Tafeln. (Robert Harding / Robert Harding Weltbilder / Corbis) Rao und seine Mitarbeiter veröffentlichten ihre Ergebnisse im Mai in der Zeitschrift Science . Sie haben die Sprache nicht entschlüsselt, aber ihre Erkenntnisse haben das Verständnis dafür geschärft. (Robert Harding / Robert Harding Weltbilder / Corbis) Rao und seine Kollegen betrachten nun längere Zeichenfolgen, als sie im Science Paper analysiert haben. Das Finden von Mustern würde wiederum dazu beitragen, festzustellen, zu welchen Sprachfamilien das Skript gehören könnte. (Mit freundlicher Genehmigung von David Zax)

An einem Sommertag in Seattle hieß mich Rao in seinem Büro willkommen, um mir zu zeigen, wie er und seine Kollegen mit dem Problem umgegangen waren. Er stellte eine Sammlung von Nachbildungen von Seehundabdrücken aus, die Archäologen von Indus-Stätten gefunden haben. Sie sind klein - wie kleine quadratische Schokoladen - und die meisten von ihnen zeigen ein Tierbild unter einer Reihe von Indus-Symbolen. Die meisten Beispiele des Indus-Skripts sind Miniaturen wie diese, die nur wenige Zeichen enthalten. Es wurden keine großen Monolithen entdeckt. Gelehrte sind sich der Funktion der kleinen Siegel nicht sicher, teilte mir Rao mit, aber eine Theorie besagt, dass sie möglicherweise verwendet wurden, um die Qualität der gehandelten Waren zu bestätigen. Eine andere Vermutung besagt, dass mit den Siegeln sichergestellt werden konnte, dass Händler beim Betreten oder Verlassen einer Stadt Steuern entrichteten - viele Siegel wurden in den Ruinen von Torhäusern gefunden, die möglicherweise wie alte Mautstellen funktionierten.

Rao und seine Kollegen versuchten nicht, Wunder zu wirken - sie wussten, dass sie nicht genug Informationen hatten, um die alte Schrift zu entziffern -, aber sie nahmen an, dass sie mit Hilfe von Rechenmethoden zumindest feststellen konnten, welche Art von Indus-Schrift sie verfassten Drehbuch war: Hat es die Sprache verschlüsselt oder nicht? Sie taten dies unter Verwendung eines Konzepts namens "bedingte Entropie".

Trotz des imposanten Namens ist die bedingte Entropie ein ziemlich einfaches Konzept: Sie ist ein Maß für die Zufälligkeit in einer Sequenz. Betrachten Sie unser Alphabet. Wenn Sie Scrabble-Kacheln nehmen und in die Luft werfen, finden Sie möglicherweise jeden alten Buchstaben, der nach dem anderen auftaucht. In englischen Wörtern treten bestimmte Buchstaben jedoch mit größerer Wahrscheinlichkeit nach anderen auf. Auf ein q in Englisch folgt fast immer ein u . Auf ein t kann ein r oder e folgen, aber es ist weniger wahrscheinlich, dass auf ein n oder ein b folgt.

Rao und seine Mitarbeiter - eine internationale Gruppe aus Informatikern, Astrophysikern und Mathematikern - verwendeten ein Computerprogramm, um die bedingte Entropie der Indus-Schrift zu messen. Dann maßen sie die bedingte Entropie anderer Arten von Systemen - natürlicher Sprachen (Sumerisch, Tamilisch, Sanskrit und Englisch), einer künstlichen Sprache (der Computerprogrammiersprache Fortran) und nichtsprachlicher Systeme (menschliche DNA-Sequenzen, bakterielle Proteinsequenzen und zwei künstliche Datensätze, die hohe und niedrige Extreme der bedingten Entropie darstellen). Als sie das Ausmaß der Zufälligkeit in der Indus-Schrift mit dem der anderen Systeme verglichen, stellten sie fest, dass es den Raten in den natürlichen Sprachen am ähnlichsten war. Sie veröffentlichten ihre Ergebnisse im Mai in der Zeitschrift Science .

Wenn es wie eine Sprache aussieht und sich wie eine Sprache verhält, dann ist es wahrscheinlich eine Sprache, wie ihr Artikel vorschlägt. Die Ergebnisse entschlüsseln die Schrift natürlich nicht, aber sie schärfen unser Verständnis und beruhigen diejenigen Archäologen, die unter der Annahme gearbeitet hatten, dass die Indus-Schrift die Sprache verschlüsselt.

Nach der Veröffentlichung der Zeitung bekam Rao eine Überraschung. Es stellt sich heraus, dass die Frage, zu welcher Sprachfamilie das Drehbuch gehört, heikel ist: Aufgrund des Alters und der Bedeutung der Indus-Zivilisation möchten viele zeitgenössische Gruppen in Indien es als direkten Vorfahren bezeichnen. Zum Beispiel möchten die Tamil sprechenden Indianer des Südens lieber lernen, dass die Indus-Schrift eine Art Protodravidian ist, da Tamil von Protodravidian abstammt. Hindi-Sprecher im Norden würden es eher eine alte Form von Sanskrit, einem Vorfahren des Hindi, sein. Raos Aufsatz schließt nicht, zu welcher Sprachfamilie das Drehbuch gehört, obwohl er feststellt, dass die bedingte Entropie dem alten Tamil ähnlich ist, was einige Kritiker veranlasst, "uns kurz zu beschuldigen, dravidische Nationalisten zu sein", sagt Rao. "Die Grausamkeit der Anschuldigungen und Angriffe war völlig unerwartet."

Rao ist manchmal erleichtert, in die weniger hart umkämpfte Welt der Neurowissenschaften und der Robotik zurückzukehren. Der Aufruf des Indus-Skripts bleibt jedoch verführerisch, und „was früher ein Hobby war, monopolisiert heute mehr als ein Drittel meiner Zeit“, sagt er. Rao und seine Kollegen betrachten nun längere Zeichenfolgen, als sie im Science Paper analysiert haben. „Wenn es Muster gibt“, sagt Rao, „könnten wir uns grammatische Regeln ausdenken. Dies würde wiederum die Art der Sprachfamilien einschränken, zu denen das Skript gehören könnte.

Er hofft, dass seine zukünftigen Erkenntnisse für sich selbst sprechen und weniger Groll von Gegnern auslösen werden, die in einer Region Indiens gegen eine andere sind. Wenn Rao seinerseits darüber spricht, was die Indus-Schrift für ihn bedeutet, neigt er dazu, in Bezug auf Indien als Ganzes zu sprechen. "Das Erbe Indiens wäre erheblich bereichert, wenn wir die Indus-Zivilisation verstehen könnten", sagt er. Rao und seine Mitarbeiter arbeiten daran, eine Zeile Quellcode nach der anderen.

Können Computer eine 5.000 Jahre alte Sprache entschlüsseln?