Neues aus der Wissenschaft: Der digitale Reporter

Nr. 5 –

Die «Los Angeles Times» hat es bereits 2007 getan, das Wirtschaftsmagazin «Forbes» macht es seit 2012, und 2014 ist auch die Nachrichtenagentur Associated Press (AP) eingestiegen. Die Dunkelziffer dürfte hoch sein – denn viele Zeitungen mögen nicht zugeben, dass sie es ebenfalls tun. Zumindest hüten sich Firmen wie Narrative Science oder AX Semantics, die Namen ihrer Medienkunden preiszugeben; und zwar auf expliziten Wunsch ebendieser Kunden.

Es geht um «automatisierten Journalismus» – so der Titel der Studie, die der Kommunikationswissenschaftler Andreas Graefe von der Ludwig-Maximilians-Universität in München im Januar publiziert hat. Dahinter steht das Schreckgespenst des digitalen Reporters: ein Algorithmus, der Zeitungstexte schreibt. Vorerst kommen Algorithmen vor allem dort zum Einsatz, wo eine grosse Zahlenbasis vorhanden ist – bei Sportresultaten und Finanzberichten. Mittlerweile werden die computergenerierten Texte bei AP nicht mal mehr von einem Redaktor kontrolliert. Weil, so Graefe, die Algorithmen weniger Fehler machten als Menschen und von den LeserInnen als glaubwürdiger wahrgenommen würden.

Die «Los Angeles Times» experimentiert seit Jahren auch mit Kriminalstatistiken. Mittlerweile veröffentlichen die Algorithmen der «Los Angeles Times» sogar «crime alerts», Warnhinweise zu städtischen Gebieten, in denen die Gefahr erhöht ist, Opfer eines Verbrechens zu werden. Basis für diese «crime alerts» sind lokale Polizeirapporte sowie ein interaktiver Stadtplan, der nach demografischen Daten und Kriminalitätsstatistiken aufgeschlüsselt ist. Doch wieso in einer Woche gleich vier schwarze Jugendliche in Compton von Polizisten erschossen worden sind, darauf hat der digitale Reporter keine Antworten parat.

Mit der Analyse von Korrelationen, die sich aus den Daten ergeben, ist es nämlich so eine Sache: Die Algorithmen sind nicht fähig, kausale Zusammenhänge zu erklären. Was zu mitunter amüsanten Vergleichen führt – etwa dem, dass die Zahl von tödlichen Stürzen in den Swimmingpool eng mit den Filmauftritten von Nicolas Cage korrespondiert.

Wenn also Firmen wie AX Semantics oder Narrative Science behaupten, die von ihnen entwickelten Algorithmen könnten bereits heute die Hälfte einer Tageszeitung bespielen und innerhalb der nächsten zehn Jahre neunzig Prozent aller News schreiben, nehmen wir analog vernetzten JournalistInnen das doch eher gelassen zu Kenntnis.

Die absurdesten computergenerierten Korrelationen finden sich auf www.tylervigen.com/spurious-correlations