Künstliche Intelligenz “Libratus” schlägt Pokerprofis

Poker: Das ist doch Zockerei, ein Glücksspiel. Von wegen – das denken nur Leute, die keine Ahnung haben. Oder die eine politische oder “moralische” Agenda verfolgen, denn kurioserweise hat die Einstufung ja gravierende Konsequenzen: Auf der einen Seite sagen Rechtspolitiker oder Juristen: “Glücksspiel; also ist das nach den und den Gesetzen verboten”. Dann wären allerdings konsequenterweise auch erzielte Gewinne steuerfrei. Oder anders herum, wenn der Staat Kohle sehen will, dann sind Gewinne aus Pokerturnieren plötzlich doch wieder steuerpflichtig – dann ist Poker also ein Geschicklichkeitsspiel oder ein Denksport.

Embed from Getty Images

Und da kann man nur sagen – das letztere stimmt. Natürlich gibt es beim Poker eine Zufallskomponente, die gemischten und verteilten Karten. Aber über eine große Anzahl von Spielen, von gespielten Händen, wie man sagt – da ist das Können der Spieler entscheidend, da setzt sich der Meister gegen den Patzer, den „Fisch“ durch – und zwar todsicher, mit einer kalkulierbaren Marge. Genau das war also auch der Grund, warum das „Brain versus AI Poker tournament“ im Rivers Casino in Pittsburgh über 20 Tage und 120.000 gespielte Hände ging – um das Kartenglück zu neutralisieren und am Ende einen klaren Sieger zu haben, möglichst mit eindeutiger statistischer Signifikanz.

Ein weiterer Anti-Glückseffekt-Korrekturfaktor: Dong Kim, Jimmy Chou, Daniel McAulay und Jason Les traten ja “Heads up”, also jeder für sich allein gegen die “Künstliche Intelligenz” Libratus an – und da bekamen jeweils zwei Menschen genau die Karten gegen den Computer, die der Computer gegen die beiden anderen Menschen spielen musste. Am Ende war das Resultat völlig klar – alle Profis waren geschlagen; die Überlegenheit war nicht nur statistisch signifikant, sondern überwältigend – eindeutig eine “super human performance”, wie es Programmierer Tuomas Sandholm ausdrückt.

The Brains vs Artificial Intelligence competition at the Rivers Casino in Pittsburgh. Photograph: Carnegie Mellon University

Fast schon überraschenderweise nutzt Libratus keine neuronalen Netze – Sandholm missfällt nämlich, dass es beim “Deep Learning” keine Garantien für die Güte einer Problemlösung gibt, keine Garantien dafür, dass bei einer leichten Modifikation des Problems (hier also der Spielweise der Poker-Gegner…) immer noch ein gutes Ergebnis erzielt wird, keine Garantien dafür, dass nicht irgendwo in der “Black Box” der neuronalen KI der Faktor Zufall sein Unwesen treibt. Die verbesserten Algorithmen, die in Libratus zum Einsatz kommen, konvergieren hingegen mathematisch nachweisbar zum spieltheoretischen Optimum, dem Nash-Equilibrium; und das sogar mit einem klar benennbaren Gütefaktor.

Das ist zumindest ein bemerkenswerter Ansatz – für Sandholm ist nämlich Poker und Libratus nur ein “proof of concept”, ein “Showcase”. Und auch in der “realen Welt” lassen sich viele vermeintlich komplexere Konstellationen auf die “Heads up”-Pokersituation “Spiel mit zwei nicht-kooperativen Gegnern und nicht vollständiger Information” eindampfen:

A lot of real world situations are two player, like most military settings are two player games. Cyber security is typically a two player setting – and by player I mean that there can be multiple hackers, but conceptually it’s like “hacker versus defenders”; so it is a two player setting even if there are multiple hackers, maybe even multiple defenders.

Libratus lief während des Matches auf einem Supercomputer – noch steht also die Rechen- und Spielpower nicht für “jedermann” zur Verfügung. Trotzdem ist es wahrscheinlich nur eine Frage der Zeit, bis das Online-Pokerspielen um Geld sinnlos bzw. hoffnungslos wird – auch jetzt sind ja Bots schon ein ernstes Problem. Stephan Kalhamer, Diplom-Mathematiker, ehemaliger Poker-Profi und Präsident des “Deutschen Poker Sportbunds” weist darauf hin, dass die Komplexität am “vollbesetzten” Pokertisch, also vor dem Eintreten der “Heads up”-Situation, ja noch einmal deutlich komplizierter ist.

In der Tat haben Libratus bzw. sein Schöpfer Tuomas Sandholm dafür noch gar kein Konzept.

We are not really working on multi player, because it’s not even clear what you would want to compute there. One option would have to say, it’s okay, you want to compute a Nash equilibrium strategy. But in multi player games that is not safe. So it’s not clear that you would even want that, even if you had an oracle for immediately computing one. So it’s more a conceptual problem, or what the goal even is in those games. And while in two player settings – two players who are in some games like “Heads up Poker”, there it’s very clear that Nash equilibrium is safe.

Abgezockt vom Computer – Künstliche Intelligenz schlägt Pokerprofis

Deutschlandfunk – Forschung aktuell vom 09.02.2017 (Moderation: Ralf Krauter)

…zum gleichen Thema der Artikel bei Spiegel Online:

Poker Mensch gegen Maschine: Libratus, der Gangster – SPIEGEL ONLINE

Spiegel Online – Netzwelt vom 08.02.2017

…und das Gespräch bei DRadio Wissen am 20.01. – da war das Match “Mensch gegen Maschine” noch nicht entschieden…

DRadio Wissen – Grünstreifen vom 20.01.2017 (Moderation: Dominik Schottner)

Michael Gessat

Künstliche Intelligenz “Libratus” schlägt Pokerprofis

Schreibe einen Kommentar Antworten abbrechen