Für Menschen kann es ein Leben dauern, bis Schach gemeistert ist. Das neue künstliche Intelligenz-Programm AlphaZero von Google DeepMind kann sich jedoch selbst beibringen, das Board in wenigen Stunden zu erobern.
Aufbauend auf den bisherigen Erfolgen mit der AlphaGo-Suite - einer Reihe von Computerprogrammen, die für das chinesische Brettspiel Go entwickelt wurden - weist Google darauf hin, dass das neue AlphaZero nicht nur bei einem, sondern bei drei Brettspielen eine übermenschliche Leistung erzielt. Schach und Shogi (im Wesentlichen japanisches Schach). Das Team von Informatikern und Ingenieuren unter der Leitung von David Silver von Google berichtete kürzlich in der Fachzeitschrift Science über seine Ergebnisse.
"Zuvor konnte man mit maschinellem Lernen eine Maschine dazu bringen, genau das zu tun, was man wollte - aber nur das", sagt Ayanna Howard, eine Expertin für interaktives Rechnen und künstliche Intelligenz am Georgia Institute of Technology, die nicht an der Konferenz teilgenommen hat Forschung. "Aber AlphaZero zeigt, dass man einen Algorithmus haben kann, der nicht so [spezifisch] ist und der innerhalb bestimmter Parameter lernen kann."
Die clevere Programmierung von AlphaZero verbessert das Gameplay für Mensch und Maschine, aber Google hat schon lange etwas Größeres im Visier: technische Intelligenz.
Die Forscher sind vorsichtig, um nicht zu behaupten, dass AlphaZero am Rande der Weltherrschaft steht (andere waren etwas schneller beim Springen). Trotzdem sind Silver und der Rest der DeepMind-Truppe bereits zuversichtlich, dass sie eines Tages ein ähnliches System für das Medikamentendesign oder die Materialwissenschaften sehen werden.
Was macht AlphaZero so beeindruckend?
Das Gameplay gilt seit langem als Goldstandard in der Forschung mit künstlicher Intelligenz. Strukturierte, interaktive Spiele vereinfachen reale Szenarien: Es müssen schwierige Entscheidungen getroffen werden. Gewinne und Verluste treiben die Einsätze in die Höhe; und Vorhersage, kritisches Denken und Strategie sind der Schlüssel.
Das Codieren dieser Art von Fähigkeiten ist schwierig. Ältere Spiel-AIs - einschließlich der ersten Prototypen des ursprünglichen AlphaGo - wurden traditionell mit Codes und Daten gefüllt, um die Erfahrung zu imitieren, die normalerweise durch jahrelanges natürliches menschliches Gameplay (im Wesentlichen ein passiver, vom Programmierer abgeleiteter Wissensdump) gewonnen wurde. Mit AlphaGo Zero (der neuesten Version von AlphaGo) und jetzt AlphaZero gaben die Forscher dem Programm nur eine Eingabe: die Regeln des fraglichen Spiels. Dann bückte sich das System und lernte die Tricks des Handels selbst aktiv.
AlphaZero basiert auf AlphaGo Zero, einem Teil der AlphaGo-Suite, die für das oben abgebildete chinesische Brettspiel Go entwickelt wurde. Frühe Iterationen des ursprünglichen Programms wurden mit Daten von Mensch-gegen-Mensch-Spielen gespeist. spätere Versionen beschäftigten sich mit Autodidakten, wobei die Software Spiele gegen sich selbst spielte, um ihre eigene Strategie zu erlernen. (Chad Miller / Flickr / CC BY-SA 2.0)Diese Strategie, die als Selbstlern-Strategie bezeichnet wird, ist genau das, was sich anhört: Um für die großen Ligen zu trainieren, hat AlphaZero sich selbst in Iterationen nacheinander gespielt und seine Fähigkeiten durch Ausprobieren verbessert. Und der Brute-Force-Ansatz hat sich ausgezahlt. Im Gegensatz zu AlphaGo Zero spielt AlphaZero nicht nur Go: Es kann auch die besten AIs der Branche bei Schach und Shogi schlagen. Der Lernprozess ist beeindruckend effizient und erfordert nur zwei, vier oder 30 Stunden Selbsthilfe, um Programme zu übertreffen, die speziell auf Shogi, Schach und Go zugeschnitten sind. Bemerkenswerterweise berichteten die Autoren der Studie nicht, dass AlphaZero mit einem tatsächlichen Menschen in Konflikt geriet, sagt Howard. (Die Forscher könnten davon ausgegangen sein, dass angesichts der Tatsache, dass diese Programme ihre menschlichen Gegenstücke ständig überfrachten, eine solche Anpassung sinnlos gewesen wäre.)
AlphaZero war auch in der Lage, Stockfish (den jetzt nicht mehr eingesetzten KI-Schachmeister) und Elmo (den ehemaligen KI-Shogi-Experten) zu besiegen, obwohl weniger mögliche nächste Züge in jeder Runde während des Spiels bewertet wurden. Da die fraglichen Algorithmen jedoch von Natur aus unterschiedlich sind und möglicherweise einen unterschiedlichen Energieverbrauch haben, ist es schwierig, AlphaZero direkt mit anderen älteren Programmen zu vergleichen, betont Joanna Bryson, die künstliche Intelligenz an der University of Bath in Großbritannien studiert und dies auch getan hat nicht zu AlphaZero beitragen.
Google hält einen Großteil des Kleingedruckten auf seiner Software in Schach, und AlphaZero ist keine Ausnahme. Wir wissen zwar nicht alles über den Stromverbrauch des Programms, aber es ist klar, dass AlphaZero einige ernsthafte Computermunition packen muss. In diesen knappen Stunden des Trainings war das Programm sehr beschäftigt und beschäftigte sich mit Zehntausenden von Übungsrunden, um seine Brettspielstrategie auf den neuesten Stand zu bringen - weit mehr, als ein menschlicher Spieler benötigen würde (oder in den meisten Fällen könnte) sogar erreichen) im Streben nach Kompetenz.
In diesem intensiven Regime wurden auch 5.000 von Googles proprietären maschinell lernenden Prozessoreinheiten (TPUs) verwendet, die nach Schätzungen rund 200 Watt pro Chip verbrauchen. Egal wie Sie es in Scheiben schneiden, AlphaZero benötigt viel mehr Energie als ein menschliches Gehirn, das mit etwa 20 Watt betrieben wird.
Der absolute Energieverbrauch von AlphaZero muss berücksichtigt werden, fügt Bin Yu hinzu, der an der Universität von Kalifornien, Berkeley, an der Schnittstelle zwischen Statistik, maschinellem Lernen und künstlicher Intelligenz arbeitet. AlphaZero ist mächtig, aber möglicherweise nicht gut für das Geld - vor allem, wenn man die Arbeitsstunden hinzufügt, die für die Erstellung und Ausführung aufgewendet wurden.
Energetisch teuer oder nicht, AlphaZero sorgt für Furore: Die meisten AIs sind auf eine einzelne Aufgabe spezialisiert, was dieses neue Programm - mit seiner dreifachen Bedrohung durch das Spiel - bemerkenswert flexibel macht. "Es ist beeindruckend, dass AlphaZero dieselbe Architektur für drei verschiedene Spiele verwenden konnte", sagt Yu.
Also ja. Die neue KI von Google setzt in mehrfacher Hinsicht neue Maßstäbe. Es ist schnell. Es ist mächtig. Aber macht das es schlau?
Hier beginnen die Definitionen zu trüben. "AlphaZero konnte von Grund auf ohne menschliches Wissen lernen, jedes dieser Spiele auf übermenschlichem Niveau zu spielen", sagte DeepMind's Silver in einer Erklärung gegenüber der Presse.
Auch wenn Brettspielkompetenz geistige Schärfe erfordert, haben alle Stellvertreter für die reale Welt ihre Grenzen. In seiner aktuellen Iteration gewinnt AlphaZero maximal von Menschen entworfene Spiele - was möglicherweise nicht die möglicherweise alarmierende Bezeichnung „übermenschlich“ rechtfertigt. Wenn AlphaZero während des Spiels von einem neuen Regelwerk überrascht wird, kann dies zu einem Flummox führen. Das eigentliche menschliche Gehirn hingegen kann weit mehr als drei Brettspiele in seinem Repertoire speichern.
Darüber hinaus ist der Vergleich der AlphaZero-Grundlinie mit einer Tabula Rasa (leere Tafel) - wie es die Forscher tun - eine Strecke, sagt Bryson. Die Programmierer füttern es immer noch mit einem entscheidenden Teil des menschlichen Wissens: den Spielregeln, die es zu spielen gilt. "Es hat weit weniger zu tun als alles zuvor", fügt Bryson hinzu, "aber das Grundlegendste ist, dass es immer noch Regeln gibt. Das ist explizit. “
Und diese lästigen Regeln könnten eine bedeutende Krücke darstellen. "Obwohl diese Programme lernen, wie man etwas leistet, brauchen sie die Regeln der Straße", sagt Howard. "Die Welt ist voll von Aufgaben, die diese Regeln nicht haben."
AlphaZero ist ein Upgrade eines bereits leistungsfähigen Programms - AlphaGo Zero, erklärt JoAnn Paul, die am Virginia Polytechnic Institute und an der State University künstliche Intelligenz und Computational Dreaming studiert und nicht an der neuen Forschung beteiligt war. AlphaZero verwendet viele der gleichen Bausteine und Algorithmen wie AlphaGo Zero und bildet immer noch nur eine Teilmenge der wahren Intelligenz. "Ich dachte, diese neue Entwicklung sei eher evolutionär als revolutionär", fügt sie hinzu. „Keiner dieser Algorithmen kann erstellen . Bei Intelligenz geht es auch um das Erzählen von Geschichten. Es stellt sich Dinge vor, die noch nicht da sind. Wir denken nicht so in Computern. “
Ein Teil des Problems ist, dass es immer noch keinen Konsens über eine echte Definition von "Intelligenz" gibt, sagt Yu - und das nicht nur im Bereich der Technologie. „Es ist immer noch nicht klar, wie wir kritisch denkende Wesen trainieren oder wie wir das unbewusste Gehirn benutzen“, fügt sie hinzu.
Bis jetzt glauben viele Forscher, dass es wahrscheinlich mehrere Arten von Intelligenz gibt. Und die Erschließung einer weit davon entfernt, die Zutaten für einen anderen zu garantieren. Zum Beispiel sind einige der klügsten Leute da draußen schrecklich im Schach.
Mit diesen Einschränkungen verbindet Yus Vision von der Zukunft der künstlichen Intelligenz Mensch und Maschine in einer Art Koevolution. Maschinen werden bei bestimmten Aufgaben sicherlich weiterhin hervorragende Leistungen erbringen, erklärt sie, aber menschlicher Einsatz und Kontrolle sind möglicherweise immer erforderlich, um das Unautomatisierte zu kompensieren.
Natürlich ist nicht abzusehen, wie sich die Situation in der KI-Arena entwickeln wird. In der Zwischenzeit haben wir viel zu überlegen. "Diese Computer sind leistungsstark und können bestimmte Dinge besser als ein Mensch", sagt Paul. "Aber das ist immer noch nicht das Geheimnis der Intelligenz."
Dieser Artikel wurde ursprünglich auf NOVA veröffentlicht.