Eine Vorankündigung “außer der Reihe” und zwei Schaltkonferenzen für die internationale Presse – einen solchen Aufwand betreibt das Fachblatt “Nature” nicht bei jedem Thema. Aber es ging ja auch schließlich um die Coverstory der aktuellen Ausgabe. Es handle sich um einen “Meilenstein in der Geschichte der KI”, so formulierte es der Chefredakteur in der Konferenzeinleitung – und danach hatten dann Demis Hassabis und David Silver das Wort. Die beiden arbeiten für “DeepMind” – eine Google-Tochterfirma (wobei der Mutterkonzern ja neuerdings “Alphabet” heißt; und sie und ihr Team hatten schon im letzten Jahr für Furore gesorgt: Mit einem Algorithmus nämlich, der virtuos Videospiele zocken kann.
Auch diesmal ging es wieder um ein Spiel, das aber für seine Anhänger weit mehr bedeutet: Zumindest in seiner Herkunftsregion China, Japan und Korea ist Go seit uralten Zeiten Ausdruck und Teil der Kultur – und außerdem ist es die letzte verbliebene Bastion im Kampf “Mensch gegen Maschine”. Während beim westlichen Schach schon seit Jahren auch die allerstärksten Spieler bis hin zum Weltmeister keine Chance mehr gegen die aktuellen Programme haben (auch wenn die auf popeliger Billig-Hardware laufen…), haben sich Algorithmen beim Go bislang immer noch äußerst schwer getan.
Und nun die Botschaft aus der Londoner DeepMind-Zentrale: Erstens habe man (bereits im Oktober) mit einem neuen Programm namens AlphaGo zum ersten Mal einen starken menschlichen Profispieler besiegt (der bedauernswerte mehrmalige Europameister Fan Hui kam mit 0-5 unter die Räder…) – und im März wolle man dann die südkoreanische Go-Legende Lee Sedol herausfordern.
(Credit: Nature Video)
Von der Spielstärke ihres Programms – es macht Konkurrenzprogramme, auch das neue aus dem Hause Facebook mit mit 99,8%er Gewinnrate nieder – war das Team anscheinend selbst etwas überrascht. Man habe auch keineswegs irgendwelche neuen Wunderdinge neu erfunden, sondern im Grunde schon vorhandene Komponenten – einen “Monte Carlo”-Suchalgorithmus und mehrere neuronale Netzwerke auf eine besonders effiziente Weise angeordnet und trainiert, so Demis Hassabis irgendwann im Verlauf der Pressekonferenz.
So symbolträchtig ein eventueller Sieg im nächsten Match auch sein würde – ob sich “AlphaGo” bzw. sein Konzept nun besonders gut auf andere Problemstellungen “in der richtigen Welt” übertragen lassen wird, das bleibt noch abzuwarten. Ein klares Sieg-oder Niederlage-Szenario ist hier eher selten. Möglicherweise sind also Dinge wie der Umgang mit unvollständiger Information oder das “One-Shot-Learning” noch wichtiger – und möglicherweise ist also der Baller-Algorithmus aus dem letzten Jahr “intelligenter” als AlphaGo.
Deutschlandfunk – Forschung aktuell vom 28.01.2016 (Moderation: Uli Blumenthal)