Wovon hängt es ab, welcher Charakter in der Kultserie “Game of Thrones” als nächster (mehr oder weniger grausam…) ins Gras beißen muss? Das lässt sich mit einer gewissen Wahrscheinlichkeit an Faktoren wie dem Alter, Geschlecht, Nobilitätsrang oder Beziehungsstatus der Figuren festmachen, behaupten Bioinformatiker von der TU München und liefern auf ihrer Website gleich handfeste Zahlen, die manchen Fan in Verzweiflung stürzen könnten. Die Prognose beruht auf einem Maschinenlern-Algorithmus. Und da klingeln ja gleich die Alarmglocken. 🙂
Zuweilen liefern die modernen Methoden bekanntlich wunderbare statistische Korrelationen, hinter denen aber bei Licht (bzw. mit gesundem Menschenverstand) betrachtet keine Kausalitäten stecken, sondern Artefakte (sprich Bullshit…). Und auf dieser potentiell sehr wackeligen Basis werden dann unter Umständen Entscheidungen von erheblicher Tragweite getroffen: Maschinenlernverfahren liefern Prognosen zur Kreditwürdigkeit, zu Sicherheitserwägungen oder zum Erfolg von medizinischen Behandlungen – ohne dass sich immer nachvollziehen oder begründen ließe, wie diese Einschätzungen eigentlich zustande kommen und wie verlässlich sie sind.
Auf den ersten Blick scheint auch das Datenmaterial der GoT-Modellierung geradezu irrwitzig zu sein: In einem realen Szenario würden biologische und soziologische Parameter natürlich sehr viel mit der Fitness oder der Überlebenswahrscheinlichkeit einer Person zu tun haben – wer gut isst und trocken schläft, lebt gesünder als der Bettler im Schlammloch. Aber in einem Roman, in einer fiktiven Welt, in einer TV-Serie gar? Da sollte sich doch doch der freie Wille der Autoren jederzeit über Plausibilitäten (und über Abbildungen realer, “biologischer” Wahrscheinlichkeiten…) hinwegsetzen können – sei es aus “Willkür”, sei es als Reaktion auf Publikumserwartungen, sei es aufgrund realer Fakten wie der Verfügbarkeit oder der Gagenforderung von Schauspielern.
Stimmt alles – und trotzdem macht die Modellierung der TU-Informatiker Sinn: Die Prognose bezieht sich halt nur auf interne, nicht offensichtliche Spielregeln oder Muster der fiktiven Welt; möglicherweise also auf die “Schreibstrategie” des Autors – und sie gilt natürlich nur, solange keine externen, “realen” Faktoren ins Spiel kommen, die in dem Maschinenlern-Datenmaterial nicht enthalten waren.
Deutschlandfunk – Wissenschaftliches Projekt zur Serie “Game of Thrones”
Deutschlandfunk – Forschung aktuell vom 2.5.2016 (Moderation: Arndt Reuning)