Schlagwort-Archive: Wissenschaft

Big Data – Handydaten verraten Wohlstand und Armut

Dass ein Mobiltelefon billig oder teuer sein kann, ist klar. Aber dass die Mobiltelefon-Nutzung etwas darüber verraten kann, ob der Besitzer oder die Besitzerin eher reich oder eher arm ist – darauf muss man erst einmal kommen. Oder man muss einen Computer darauf kommen lassen.

Das Versprechen von Big-DataModellen ist ja: Im Idealfall findet der Algorithmus in ziemlich unstrukturiertem Datenmaterial plötzlich Zusammenhänge, gewinnt neue Erkenntnisse, die bislang unentdeckt waren. Im banalsten und gleichzeitig auch häufigsten Szenario sind das ökonomische Erkenntnisse – wer bei Amazon schon drei Pferdehof-Bücher gekauft hat, interessiert sich vielleicht auch für einen Reitkurs; wer anscheinend dauernd mit Höchstgeschwindigkeit auf der Autobahn unterwegs ist, braucht vielleicht ein noch schnelleres Auto, einen Zeitmanagement-Ratgeber oder eine Risiko-Lebensversicherung 🙂 .

Das ganz große Problem bei Big-Data-Ansätzen: Der Algorithmus spürt statistische Korrelationen auf (z.B. die Länge von Röcken zur Aktienperformance…) – aber ob letztlich wirklich ein Kausalzusammenhang dahinter steht, das kann man nur mit gesundem Menschenverstand oder mit einem Abgleich anhand von völlig unabhängigen Datenquellen überprüfen.

Auch Joshua Blumenstock von der University of Washington kann nicht bis ins letzte Detail erklären, warum Reiche in Ruanda andere Mobilfunk-Kommunikationsmuster haben als Arme. Aber ganz offensichtlich passt seine in der aktuellen Ausgabe von „Science“ vorgestellte Big-Data-Abschätzung des ökonomischen Status von Handy-Nutzern sehr gut zu Daten aus der realen Welt. Eine neue, preiswerte und ziemlich verlässliche Methode also gerade in Entwicklungsländern, Politikern eine Basis für ökonomische Entscheidungen zu geben – für Infrastruktur-Investitionen, Sozialmaßnahmen oder Steuertarife. Vorausgesetzt, die Entscheidungen sollen überhaupt aufgrund von objektiven Kriterien gefällt werden 😉 …

Big Data – Handydaten verraten Wohlstand und Armut

Deutschlandfunk – Forschung aktuell vom 27.11.2015 (Moderation: Monika Seynsche)

Grippe-Prognose mit Google-Daten: „ARGO“ will Schwächen von „Flu Trends“ ausbügeln

Als Google 2008 die „Flu Trends“ vorstellte, war das Projekt ein erstes Musterbeispiel für die Auswertung von „Big Data“, für den möglichen Erkenntnisgewinn also aus einer riesigen Menge weitgehend unstrukturierter Daten. Die ursprüngliche Idee ist nach wie vor plausibel: Wenn plötzlich sehr viele Menschen in einer bestimmten Region im Netz nach Begriffen wie „Schnupfen, Fieber, und Grippe“ suchen, dann sind sie oder ihre Angehörigen wahrscheinlich betroffen – und wenn das Suchinteresse ein bestimmtes Maß überschreitet, dann deutet das auf eine drohende Epidemie hin.

Der Charme des „Flu Trend“-Modells: Die Prognose arbeitet quasi in Echtzeit. Der Haken: Sie beruht auf einer Hypothese, nicht auf realen Krankheitsfalldaten. Kritik an der Methodik und Vorhersagegenauigkeit des im Sommer eingestellten Google-Modells gab es laufend; als Alternative liefert z.B. die Auswertung der Anfragen bei Wikipedia deutlich bessere Prognosen.

Aber der Ansatz auf der Basis von Suchmaschinendaten ist nach wie vor brauchbar, schreiben Statistiker von der Harvard University im Fachblatt PNAS. Ihr neues Prognosemodell ARGO hält konsequent Tuchfühlung mit der Realität – zum einen durch einen ständigen Abgleich mit den tatsächlich gerade verwendeten Suchbegriffen, zum anderen durch einen ständigen Abgleich mit den gerade erhobenen Grippe-Krankheitsdaten der Gesundheitsbehörden. Die permanente Selbstkalibrierung macht die ARGO-Vorhersagen erheblich verlässlicher als die der Konkurrenz-Prognosemodelle, das zeigen die Forscher zumindest anhand der historischen Daten.

Fehlt also nur noch der Praxistest – auch ARGO arbeitet nur mit Wahrscheinlichkeiten und statistischen Modellierungen. Und wie heißt es so schön: Prognosen sind eine heikle Angelegenheit; vor allem, wenn sie sich auf die Zukunft beziehen.

DRadio Wissen · Neue Grippe-Prognose „ARGO“: Dem Schnupfen entkommen

DRadio Wissen – Schaum oder Haase vom 10.11.2015 (Moderation: Marlis Schaum)

P.S. – Ob eine netzbasierte Echtzeit-Situationseinschätzung bzw. eine Echtzeit-Prognose auf der Basis eines statistischen Modells gegenüber einem Lagebild oder einer Prognose auf Basis von validierten Realdaten wirklich allzu viel bringt, das kann man bezweifeln, sagt Silke Buda vom Robert-Koch-Institut. Der zeitliche Vorsprung der Netz-Prognose beträgt im besten Fall zwischen drei bis maximal acht Tagen – aber auch eine statistisch signifikante Aussage „geringe Grippe-Wahrscheinlichkeit“ schützt ein Individuum ja nicht vor einem individuellen Infektionsrisiko.

Nach wie vor ist die beste Grippe-Prophylaxe gerade für Risikogruppen die rechtzeitige Impfung. Die nimmt man am besten vor der Grippe-Saison vor, also bevor statistische Modelle oder die Realdaten-Reports Alarm schlagen.

Deutschlandfunk: Suchmaschinendaten – Neuer Anlauf für die Grippeprognose

Deutschlandfunk – Forschung aktuell vom 18.11.2015 (Moderation: Uli Blumenthal)

P.S. 4.1.2016: Die mit „ARGO“ ermittelten Vorhersagen sind nun – zusammen mit den Daten bzw. Prognosen aus weiteren Quellen – abrufbar unter www.healthmap.org/flutrends/.

Eine Ausweitung des Modells auf andere Regionen und andere Infektionskrankheiten wie Dengue ist offenbar geplant.

Mit Handy-Bewegungsdaten lassen sich Epidemien genauer vorhersagen

Darüber, was eine Person den ganzen Tag oder auch das ganze Jahr über so treibt, wo sie wohnt, studiert, arbeitet; wo sie Freunde oder Verwandte besucht oder den Urlaub verbringt – darüber weiß eine Instanz sehr genau Bescheid: Der Mobilfunkprovider. Denn wir alle tragen ja praktisch immer einen Bewegungsmelder mit uns herum – unser Handy.

Und wenn man viele solcher individuellen Bewegungsprofile in einen großen Topf wirft und auswertet, dann lassen sich daraus interessante und nützliche Rückschlüsse ziehen und Vorhersagen treffen. Für manche solcher Prognosen braucht man Echtzeitdaten und die exakten GPS-Positionsmeldungen entsprechend ausgestatteter Smartphones – zum Beispiel um einen sich entwickelnden Stau auf einer bestimmten Autobahn zu identifizieren.

Einfachere Mobiltelefone übermitteln ihre Position nur beim Wechsel der Funkzelle, bei einem Telefonat oder beim Versenden oder Empfangen einer SMS. Aber auch das genügt, um die Bewegungsmuster ihrer Besitzer ziemlich genau zu erfassen. Und etwas langsamer als Staus ablaufende Dinge vorhersagen zu können – zum Beispiel den Ausbruch von Infektionskrankheiten.

Die Epidemiologin Caroline Buckee und ihre Kollegen hatten im Jahr 2013 in Kooperation mit einem großen Mobilfunkprovider in Pakistan Zugriff auf die per Handy ermittelten Mobilitätsdaten von fast 40 Millionen Nutzern – das entspricht einem Fünftel der pakistanischen Bevölkerung. Und mit diesen Mobilitätsdaten ließ sich, so das Ergebnis der im Fachblatt PNAS veröffentlichten Studie, der Ausbruch des gefährlichen Dengue-Fiebers in bestimmten Gegenden wesentlich besser prognostizieren als bisher.

Unter Umständen tauchen nämlich infizierte Personen aus einem Seuchengebiet schon deutlich früher in einer bislang seuchenfreien Region auf, als man rein von der Entfernung her vermuten würde – wenn diese Personen eben konkreten Bewegungsmustern folgen, hinter denen konkrete Beweggründe stecken.

Eine genauere Vorhersage kann Behörden und Ärzten dabei helfen, auf eine Epidemie besser vorbereitet zu sein, sagt Caroline Buckee – und das nicht nur bei der Ausbreitung von Dengue-Fieber in Pakistan:

Die Methode selbst kann eigentlich bei jeder Infektionskrankheit zum Einsatz kommen, wir haben ähnliches bei Malaria getestet, wir denken darüber nach bei Cholera und natürlich bei Ebola. Wir arbeiten daran, die Mobilität in Westafrika zu erfassen – Menschen reisen nun einmal, und Menschenansammlungen begünstigen die Übertragung von allen Infektionskrankheiten.

Die Studie in Pakistan hatte einen sehr „konservativen“ Ansatz, so Caroline Buckee: die Mobilitätsdaten wurden anonymisiert und aggregiert, so dass kein Bewegungsprofil einer individuellen Person ablesbar war. Theoretisch hat die Methode aber natürlich Potential in die andere Richtung – bis hin zu einer Identifizierung und Zwangs-Quarantäne einer Person aus einem Risiko-Gebiet.

Ähnlich also wie bei anderen Big-Data-Anwendungen: Es gibt ein Spannungsfeld zwischen den potentiell nützlichen und detaillierteren Auswertungsmöglichkeiten und den Aspekten von Datenschutz und persönlicher Freiheit.

DRadio Wissen – Schaum oder Haase vom 8.9.2015 (Moderation: Marlis Schaum)

3D-Scan kann biologisches Alter ermitteln

Ob es hauptsächlich an der genetischen Ausstattung liegt oder aber an den Lebensumständen, das ist noch nicht endgültig erforscht – fest steht jedenfalls: Das chronologische Alter, das im Personalausweis verzeichnet steht, und das biologische Alter, der tatsächliche „Erhaltungszustand“ einer Person können weit auseinander liegen. Anders gesagt: Manche Leute altern schneller, manche langsamer als ihre Mitmenschen.

Und anscheinend ist das auch ganz schlicht und ergreifend im Gesicht zuverlässig ablesbar – die inneren Werte und die geistige Fitness in allen Ehren: Chinesische Wissenschaftler konnten die intuitive Vermutung jetzt mit Computerunterstützung bestätigen. Ein einfacher 3D-Scan reicht offenbar für eine recht treffsichere Abschätzung des „wahren“, des biologischen Alters einer Person. Das ist nützlich für maßgeschneiderte medizinische Behandlungen, macht aber auch möglicherweise eine andere Branche hellhörig, vermutet die Studienleiterin Prof. Jing-Dong Han:

„Als ich darüber mit meinen Freunden gesprochen habe, haben die gesagt – das ist natürlich interessant für Versicherungen, die können damit Zuschläge oder Nachlässe kalkulieren – ich weiß nicht, ob das gut oder schlecht ist.“

Zumindest könnte ja das nunmehr wissenschaftlich bestätigte Motto „Man ist so alt, wie man aussieht“ Schönheitschirurgen als Werbeaussage dienen – nur leider kann ja die durchs Messer modifizierte Gesichtsgeometrie zwar die intuitive und sicher auch evolutionär verankerte Alters-Abschätzung anderer Menschen (und eventuell die des 3D-Scanners…) täuschen, nicht aber wirklich zu einem längeren Leben verhelfen…

Aussehen – Biologisches Alter ins Gesicht geschrieben.

Deutschlandfunk – Forschung aktuell vom 2.4.2015

Twitter als politisches Stimmungsbarometer

Dass Twitter eine äußerst beliebte Datenquelle für Meinungsforscher aller Couleur ist – sei es aus der Werbebranche, aus der Politik oder aus der Wissenschaft, das ist nichts neues.

Insofern überrascht an der Studie, die spanische Forscher im Fachblatt „Chaos“ vorstellen, gar nicht einmal so sehr das grundsätzliche Ergebnis, sondern eher dessen Deutlichkeit. Die Wissenschaftler haben anhand von Tweets rund um den Tod des ehemaligen Präsidenten von Venezuela, Hugo Chavez, das Ausmaß der politischen Polarisierung  und die geografische Verteilung des Stimmungsbildes nachverfolgt – die exakt die Aufteilung in wohlhabendere und ärmere Bevölkerungsschichten in Venezuelas Hauptstadt Caracas widerspiegelte.

Dass Twitter demnach als Warninstrument für drohende gewalttätige Auseinandersetzungen taugt, ist plausibel – ob man einer extremen Polarisierung der politischen Meinung aber wiederum per Social Network gegensteuern kann oder sollte, wie die Autoren spekulieren, das ist dann doch sehr fraglich. Sonst kommt  vielleicht noch so etwas dabei heraus. 🙂

DRadio Wissen · Liveblog: Todesstrafe, Doping, Tröglitz, Niklas.

DRadio Wissen – Schaum oder Haase vom 1.4.2015

Mehr Erfolg beim Online-Dating – ganz wissenschaftlich

Was man immer schon wissen wollte, aber sich nie zu fragen traute – wie zum Beispiel eine möglichst effiziente Transformation eines Online-Kontaktes in ein erstes Date funktioniert.

Die Wissenschaft gibt Auskunft, und zwar in einer nicht ganz zufällig am Vorabend des Valentinstags veröffentlichten Meta-Studie im British Medical Journal. An die 4000 Fundstellen aus Fachpublikations-Datenbanken haben die Autoren gesammelt und verdichtet, immerhin noch 86 Studien aus Medizin, Psychologie und Soziologie dann systematisch ausgewertet – und hochinteressante Dinge herausgefunden. So ist es etwa ratsam, ein Pseudonym mit einem Anfangsbuchstaben aus der ersten Hälfte des Alphabets zu wählen; solchen Namen schreibt man nämlich unbewusst ein höheres Einkommen und eine höhere Bildung zu – außerdem erscheinen sie halt bei der Suche als erste. Auf die meisten anderen Erkenntnisse bzw. Tipps wäre man wahrscheinlich auch selbst gekommen, von der Auswahl eines geeigneten Fotos (mit geneigtem Kopf und Lachfalten um die Augen…) über das richtige Profil-Texten (70% Selbstdarstellung, 30% Wünsche an einen potentiellen Partner) bis hin zum erfolgverheißenden Chat- oder Mailverhalten (immer positiv aufhören!) – Captain Obvious lässt grüßen. Aber von Prof. Dr. Obvious erforscht und bestätigt klingt das alles eben doch noch einen Tick fundierter.

Wobei die Studie auch einen kleinen eigentherapeutischen Zweck hatte, wie aus der Danksagung am Schluss des Artikels hervorgeht: „Die Autoren möchten den potentiellen Dates ihren Dank aussprechen, die einen von uns wiederholt haben abblitzen lassen und uns so dazu ermuntert haben, über Effektivität beim Online-Dating nachzudenken.“

DRadio Wissen · Online-Dating: Die besten Tipps der Wissenschaft.

DRadio Wissen – Schaum oder Haase vom 13.2.2015

Big Data: Vermeintliche Anonymität ist schnell ausgehebelt

Im Wissenschaftsmagazin „Science“ findet man normalerweise Publikationen zu den neuesten Erkenntnissen in Physik, Chemie oder Biologie, und normalerweise sind die Science-Artikel denn auch für Nicht-Experten reichlich schwierig und speziell. In der aktuellen Ausgabe allerdings gibt es einen Themenschwerpunkt, der erstens allgemein verständlich ist, und der zweitens auch praktisch alle angeht: „Privacy in a Data-Driven World„, also „Die Privatsphäre in einer daten-gelenkten Welt“ lautet die Überschrift.

Keine schlechte Idee – denn zum einen ist die wissenschaftliche Community in gewisser Weise eine gesellschaftliche Elite mit Multiplikatoren-Potential, die wachzurütteln sich lohnt. Und zum anderen nutzen Wissenschaftler ja mittlerweile selbst sehr eifrig Big Data als Quelle neuer Erkenntnisse – sicher mit allerbesten Absichten, aber nicht unbedingt immer mit dem nötigen Blick für die damit verbundenen Gefahren.

Ein sehr konkretes Beispiel geben Forscher aus den USA und Dänemark: Wir alle erteilen als Kunden tagtäglich (überwiegend gezwungenermaßen…) unsere Einwilligung zur Nutzung unserer Daten – gegenüber dem Internet- oder Mobilfunkprovider, gegenüber der Versicherung, der Krankenkasse oder dem Kreditkartenunternehmen. Nur gehen wir dabei immer noch davon aus (und so ist das auch in Datenschutzregeln und -vereinbarungen vorgesehen…), dass aus der Big Data-Gesamtheit nicht auf uns als konkrete Einzelperson zurückgeschlossen werden kann.

Das ist offenbar eine Illusion, zeigt der Science-Artikel – schon ein paar wenige nicht anonyme zusätzliche Einzelinformationen (die sich im Netz sehr leicht auffinden lassen…) reichen aus, um uns in einem anonymisierten (bzw, pseudonymisierten) Datensatz wiederzufinden. Das Muster unseres Verhaltens; beim Autofahren, Einkaufen oder beim Googlen ist sehr viel einzigartiger, als man intuitiv annehmen würde. Und je mehr Datenfacetten in den Big Data-Topf hinzukommen, umso geringer wird die Chance, noch in der Masse unterzugehen.

Das Fazit des Science-Themenschwerpunktes: Die geltenden Datenschutzvorschriften reichen nicht aus, weder in den USA noch in Europa – wenn wir unsere Privatsphäre nicht komplett abschreiben wollen.

DRadio Wissen · Datenschutz: Warum scheinbar anonymisierte Daten im Netz nicht sicher sind.

DRadio Wissen – Schaum oder Haase vom 30.1.2015

Künstliche Intelligenz – Das fast perfekte Poker-Programm

Wenn im Film der Held gegen den Superschurken am Pokertisch sitzt, dann geht es natürlich immer um den ganz großen Einsatz – um die Milliardensumme, die schöne Frau oder um Leben und Tod. Und natürlich entscheidet immer der größte Bluff, die coolste Coolness beim Showdown für die Sache des Guten. Beim richtigen Spiel geht es zwar auch spannend und spektakulär, aber vor allem auch sehr rational zu. Natürlich kann auch der beste Pokerspieler genauso wie das beste Poker-Programm ein paar mal miserable Karten bekommen – aber der Faktor Glück spielt nur auf kurze Sicht eine Rolle.

Vom Standpunkt der Spieltheorie her ist Poker sogar viel anspruchsvoller als das als „Spiel der Könige“ geltende Schach – weil nicht alle spielrelevanten Informationen verfügbar sind. Genau das macht aber auch Algorithmen wie die von Michael Bowling und Kollegen, die mit solch lückenhafter Ausgangsbasis gut zurecht kommen, für Alltagssituationen interessant – das richtige Leben ist schließlich ein einziges Entscheiden-Müssen und Herumstochern im Ungefähren…

Ob „Künstliche Intelligenz“ allerdings tatsächlich in sicherheitskritischen Situationen hilfreich ist, das bleibt noch nachzuweisen. Beim Atomkrieg zum Beispiel könnte bei einem spieltheoretischen Optimierungsversuch auch herauskommen, dass beide Seiten tot sind.

Künstliche Intelligenz – Das fast perfekte Poker-Programm.

Deutschlandfunk – Forschung Aktuell vom 9.1.2015

Gefahr durch WLAN-Strahlung?

Hamburg stoppt ein Schulprojekt mit Tablet-Einsatz; und zwar wegen Bedenken über die eventuelle Gefährdung der Schüler durch die WLAN-Strahlung – so lautete am 1.12. die Meldung in verschiedenen Online-Medien. In Umlauf gebracht hatte die Geschichte die Schleswig-Holsteinische Zeitungsgruppe, am Abend dementierte dann die Hamburger Schulbehörde. In der Tat wäre die Sache auch seltsam gewesen, denn anders als bei den zahllosen Studien und Gegenstudien über mögliche Gefahren der elektromagnetischen Strahlung beim Handy-Gebrauch war die WLAN-Nutzung eigentlich nie besonders im Fokus der Diskussion – aus guten Gründen, denn zum einen ist die Strahlungsintensität geringer, zum anderen hält man ein Tablet oder auch Smartphone beim Surfen nicht an den Kopf. Trotzdem empfiehlt das Bundesamt für den Strahlenschutz durchaus auch beim Umgang mit WLAN eine so weit als mögliche Minimierung der Strahlen-Exposition.

Letztlich bleibt das ganze Thema ein Stück weit Glaubenssache – denn auch wenn man bei Einhaltung aller Grenzwerte nach jetzigem Stand der Erkenntnisse davon ausgehen kann, dass all die fröhlich umherfunkenden Dinger uns nicht schaden; erwiesen ist das auch noch keineswegs. Schließlich läuft das Experiment mit der selbstgebastelten elektromagnetischen Exposition unserer Spezies ja erst seit ein paar Jährchen.

DRadio Wissen · Liveblog: Burka.

DRadio Wissen – Schaum oder Haase vom 2.12. 2014

Social Media als Daten-Quelle für wissenschaftliche Studien heikel

Einerseits sind die Social Media für Wissenschaftler, insbesondere bei der Erforschung des menschlichen Verhaltens, eine Fundgrube und Schatzkiste – hier gibt es Daten frei Haus; mit im Vergleich zu herkömmlichen Studien oder Umfragen irrwitzig hohen „Teilnehmerzahlen“. Aber gerade das täuscht darüber hinweg, dass es bei Twitter, Facebook oder Pinterest keine repräsentativen oder normalverteilten Meinungsäußerungen gibt; sei es durch die Zusammensetzung der Plattform-Klientel bedingt, sei es durch intransparente Algorithmen-Trickserei der Betreiber. Wer die dadurch produzierte Abweichung zur Realität, den Bias-Effekt (den es natürlich auch bei Studien mit „analogen“ Versuchspersonen gibt…) nicht berücksichtigt, misst Mist – warnt ein Artikel im wissenschaftlichen Fachblatt Science.

DRadio Wissen – Schaum oder Haase vom 28.11.2014