Als Google 2008 die “Flu Trends” vorstellte, war das Projekt ein erstes Musterbeispiel für die Auswertung von “Big Data”, für den möglichen Erkenntnisgewinn also aus einer riesigen Menge weitgehend unstrukturierter Daten. Die ursprüngliche Idee ist nach wie vor plausibel: Wenn plötzlich sehr viele Menschen in einer bestimmten Region im Netz nach Begriffen wie “Schnupfen, Fieber, und Grippe” suchen, dann sind sie oder ihre Angehörigen wahrscheinlich betroffen – und wenn das Suchinteresse ein bestimmtes Maß überschreitet, dann deutet das auf eine drohende Epidemie hin.
Der Charme des “Flu Trend”-Modells: Die Prognose arbeitet quasi in Echtzeit. Der Haken: Sie beruht auf einer Hypothese, nicht auf realen Krankheitsfalldaten. Kritik an der Methodik und Vorhersagegenauigkeit des im Sommer eingestellten Google-Modells gab es laufend; als Alternative liefert z.B. die Auswertung der Anfragen bei Wikipedia deutlich bessere Prognosen.
Aber der Ansatz auf der Basis von Suchmaschinendaten ist nach wie vor brauchbar, schreiben Statistiker von der Harvard University im Fachblatt PNAS. Ihr neues Prognosemodell ARGO hält konsequent Tuchfühlung mit der Realität – zum einen durch einen ständigen Abgleich mit den tatsächlich gerade verwendeten Suchbegriffen, zum anderen durch einen ständigen Abgleich mit den gerade erhobenen Grippe-Krankheitsdaten der Gesundheitsbehörden. Die permanente Selbstkalibrierung macht die ARGO-Vorhersagen erheblich verlässlicher als die der Konkurrenz-Prognosemodelle, das zeigen die Forscher zumindest anhand der historischen Daten.
Fehlt also nur noch der Praxistest – auch ARGO arbeitet nur mit Wahrscheinlichkeiten und statistischen Modellierungen. Und wie heißt es so schön: Prognosen sind eine heikle Angelegenheit; vor allem, wenn sie sich auf die Zukunft beziehen.
DRadio Wissen · Neue Grippe-Prognose “ARGO”: Dem Schnupfen entkommen
DRadio Wissen – Schaum oder Haase vom 10.11.2015 (Moderation: Marlis Schaum)
P.S. – Ob eine netzbasierte Echtzeit-Situationseinschätzung bzw. eine Echtzeit-Prognose auf der Basis eines statistischen Modells gegenüber einem Lagebild oder einer Prognose auf Basis von validierten Realdaten wirklich allzu viel bringt, das kann man bezweifeln, sagt Silke Buda vom Robert-Koch-Institut. Der zeitliche Vorsprung der Netz-Prognose beträgt im besten Fall zwischen drei bis maximal acht Tagen – aber auch eine statistisch signifikante Aussage “geringe Grippe-Wahrscheinlichkeit” schützt ein Individuum ja nicht vor einem individuellen Infektionsrisiko.
Nach wie vor ist die beste Grippe-Prophylaxe gerade für Risikogruppen die rechtzeitige Impfung. Die nimmt man am besten vor der Grippe-Saison vor, also bevor statistische Modelle oder die Realdaten-Reports Alarm schlagen.
Deutschlandfunk: Suchmaschinendaten – Neuer Anlauf für die Grippeprognose
Deutschlandfunk – Forschung aktuell vom 18.11.2015 (Moderation: Uli Blumenthal)
P.S. 4.1.2016: Die mit “ARGO” ermittelten Vorhersagen sind nun – zusammen mit den Daten bzw. Prognosen aus weiteren Quellen – abrufbar unter www.healthmap.org/flutrends/.
Eine Ausweitung des Modells auf andere Regionen und andere Infektionskrankheiten wie Dengue ist offenbar geplant.