https://frosthead.com

Diese pokerspielende KI weiß, wann sie zu halten und wann sie zu folden ist

Ein Computerprogramm namens Pluribus hat Pokerprofis in einer Reihe von Texas Hold'em-No-Limit-Spielen für sechs Spieler geschlagen und damit einen Meilenstein in der Forschung im Bereich der künstlichen Intelligenz erreicht. Es ist der erste Bot, der Menschen in einem komplexen Mehrspieler-Wettbewerb besiegt.

Wie Forscher des Facebook AI Labs und der Carnegie Mellon University in der Zeitschrift Science berichteten, gewann Pluribus sowohl von Menschen als auch von Algorithmen dominierte Matches. Zunächst schreibt Merrit Kennedy für NPR, fünf Versionen des Bots standen einem professionellen Pokerspieler gegenüber; In der nächsten Runde der Experimente spielte ein Bot gegen fünf Menschen. Pro Facebook-Blogeintrag gewann die KI durchschnittlich 5 USD pro Hand oder 1.000 USD pro Stunde, wenn sie gegen fünf menschliche Gegner spielte. Diese Quote wird von Pokerprofis als "entscheidende Gewinnspanne" angesehen.

In einem Gespräch mit Kennedy erklärt der viermalige World Poker Tour-Champion Darren Elias, dass er beim Training von Pluribus geholfen habe, indem er gegen vier Tische von Bot-Rivalen antrat und Wissenschaftler alarmierte, wenn die KI einen Fehler machte. Bald "verbesserte sich der Bot sehr schnell und entwickelte sich innerhalb weniger Tage und Wochen von einem mittelmäßigen Spieler zu einem Pokerspieler von Weltklasse." Die Erfahrung sei "ziemlich beängstigend".

Laut James Vincent von Verge beherrschte Pluribus - eine überraschend kostengünstige KI, die mit Cloud-Computing-Ressourcen im Wert von unter 150 US-Dollar trainiert wurde - die Pokerstrategie weiter, indem er gegen Kopien von sich selbst spielte und durch Ausprobieren lernte. Wie Jennifer Ouellette für Ars Technica feststellte, stellte der Bot schnell fest, dass die beste Vorgehensweise eine Kombination aus Gameplay und unvorhersehbaren Bewegungen war.

Die meisten menschlichen Profis meiden "Donk-Wetten", bei denen ein Spieler eine Runde mit einem Call beendet und die nächste mit einem Bet beginnt, aber Pluribus hat die unpopuläre Strategie gern angenommen. Gleichzeitig, so Ouellette, bot die KI auch ungewöhnliche Einsatzgrößen und zeigte eine bessere Randomisierung als die Gegner.

"Seine größte Stärke ist die Fähigkeit, gemischte Strategien anzuwenden", sagte Elias einer CMU-Erklärung zufolge. „Das ist dasselbe, was Menschen versuchen. Es ist eine Frage der Ausführung für den Menschen - dies auf vollkommen zufällige Weise und konsequent zu tun. Die meisten Leute können es einfach nicht. “

Pluribus ist nicht die erste Pokerspiel-KI, die menschliche Profis besiegt. 2017 entwickelten die Schöpfer des Bots, Noam Brown und Tuomas Sandholm, eine frühere Iteration des Programms namens Libratus. Diese KI besiegte vier Poker-Profis in 120.000 Händen von Texas Hold'em mit zwei Spielern entscheidend, war jedoch, wie der Facebook-Blog-Post erklärt, dadurch eingeschränkt, dass sie jeweils nur gegen einen Gegner antrat.

Laut Will Knight von MIT Technology Review stellt Poker eine Herausforderung für AI dar, da es mehrere Spieler und eine Vielzahl versteckter Informationen umfasst. Bei Spielen wie Schach und Go sind vergleichsweise nur zwei Teilnehmer beteiligt, und die Positionen der Spieler sind für alle sichtbar.

Um diese Hindernisse zu überwinden, haben Brown und Sandholm einen Algorithmus entwickelt, mit dem die nächsten zwei oder drei Züge des Gegners vorhergesagt werden können, anstatt ihre Schritte bis zum Ende des Spiels einzuschätzen. Obwohl diese Strategie den kurzfristigen Gewinn vor den langfristigen Gewinnen zu priorisieren scheint, hat die Vincent von Verge schreibt: "Kurzfristige Schärfe ist wirklich alles, was Sie brauchen."

In Zukunft könnten Multiplayer-Programme wie Pluribus eingesetzt werden, um Medikamente zu entwickeln, die antibiotikaresistente Bakterien bekämpfen sowie die Cybersicherheit und militärische Robotersysteme verbessern. Wie Ouellette von Ars Technica. Weitere potenzielle Anwendungen sind die Überwachung von Mehrparteienverhandlungen, die Preisgestaltung für Produkte und das Brainstorming von Auktionsgebotsstrategien.

Derzeit, so Brown gegenüber Knight, wird der Algorithmus weitgehend unbeachtet bleiben - hauptsächlich, um die Online-Pokerindustrie vor verheerenden finanziellen Verlusten zu schützen.

Der Forscher kommt zu dem Schluss: "Es könnte für die Poker-Community sehr gefährlich sein."

Diese pokerspielende KI weiß, wann sie zu halten und wann sie zu folden ist