Wordle für Open Data Dossier
1 | 2 Pfeil rechts

Datenjournalismus


26.10.2011
Datenberge sind ein Rohstoff: Regierungen, Unternehmen und Nichtregierungsorganisationen sitzen auf Unmengen von Daten und könnten diese zu Open Data machen. Die Journalismusform, die mit diesen Datensätzen arbeitet, nennt sich Datenjournalismus.

Grafik zur Einkommensverteilung in Großbritannien - nur ein Beispiel aus dem Data Blog der Zeitung GuardianGrafik zur Einkommensverteilung in Großbritannien - nur ein Beispiel aus dem Data Blog der Zeitung Guardian (© guardian.co.uk)

Das Datensätze einen Rohstoff darstellen ist mittlerweile zu einem geflügelten Wort geworden: »"Daten sind das neue Öl"«. So hatte es 2006 der Werbefachmann Michael Palmer formuliert. Unbearbeitet seien Daten wertlos. Sobald Datensätze aber behandelt werden, würden sie zu digitalen Äquivalenten von Plastik, Chemikalien oder Gas.

Es gleicht einem kollektiven Geistesblitz in Zeitlupe, der derzeit im Netz zu beobachten ist: Daten, in Tabellen gepresst, häufen sich in Datenbanken und werden minütlich mehr. Sie gehen auf Reise durchs Internet, werden von Sensoren immer neu gemessen oder per Hand erhoben. Diese Datenberge sind ein Rohstoff. Und Regierungen, Unternehmen und Nichtregierungsorganisationen sitzen auf Unmengen von Daten und könnten diese zu Open Data machen. Die Journalismusform, die mit diesen Datensätzen hantiert, nennt sich Datenjournalismus

Im gleichen Jahr schrieb Adrian Holovaty, ein Journalist und Programmierer aus den USA, einen wegweisenden Text. »"A fundamental way newspaper sites need to change"«. Seiner Meinung nach sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sondern ebenfalls Informationen unter dem Aspekt betrachten, wie ihr wesentlicher Gehalt in strukturierter Form, sprich in Datenbanken abzulegen ist. Dann, so Holovaty, lässt sich auf Dauer Mehrwert abschöpfen. Denn in diesen strukturierten Informationen lässt sich auch nach Jahren noch einfach recherieren; verknüpft mit anderen Datenbanken können publizistische Angebote damit angereichert werden.

Als Beispiel führt Holovaty Wohnungsbrände an: Würde ein Lokaljournalist beispielsweise dazu immer festhalten, welche Art von Brand es war, wieviel Verletzte und Tote es gab, wie lange die Feuerwehr bis zum Einsatzort gebraucht hatten, entstünde so nach und nach eine Datenbank, die viel über die Arbeit der Feuerwehr verraten könnte. So wie in»Amsterdam« die Feuerwehr einem Teil ihrer Daten mittlerweile selbst als Open Data Angebot zur Verfügung stellt.

Holovaty hat die Zeit Recht gegeben: data-driven-journalism oder Datenjournalismus hat seit 2009 eine steile Karriere hingelegt. Die britische Tageszeitung Guardian startete damals ein »Datablog«. Und die Redaktion war selbst überrascht auf welches Interesse die Bereitstellung von Datensätze rund um tagesaktuelle Geschehnisse stieß.

2009 war auch das Jahr, in dem in den USA der frisch vereidigte Präsident Barack Obama seine Open-Government-Direktive verkündete. Und damit der Open-Data-Bewegung enormen Schwung gab, die sie um die ganze Welt trug.

Definition: Ein neues Genre des Onlinejournalismus



Mit dem großen Datensatz der Warlogs aus Afghanistan, die Wikileaks zusammen mit einigen Medienpartnern im Sommer 2010 veröffentlichte, kam der Durchbruch für Datenjournalismus. Wie selten zuvor stand ein Datensatz im Mittelpunkt des medialen Interesses. Und vor allem wurde er den Lesern in den Online-Medien, wie im z.B. im »Guardian«, in mannigfaltiger Form zugänglich gemacht. Jenseits von Text, Bild, Ton und Bild entsteht so mit dem Datenjournalismus ein neues interaktives Erzählformat in Zusammenspiel mit Datenbanken.

Der englische Begriff "data-driven-journalism" bringt es besser auf den Punkt als das deutsche Wort Datenjournalismus. "Datengetriebener Journalismus" trifft es insofern exakter, als dass die Berichterstattung mit Unterstützung von Datensätzen geschieht; in der Regel im Internet per interaktiven Anwendungen, die auf Datenbanken zugreifen. Manchmal wird im Deutschen auch von "Datenbankjournalismus" gesprochen. Andere im Englischen gebräuchlichen und verwandete Begriffe lauten , "computational journalism", "visual journalism" sowie ebenfalls "databank journalism" oder schlicht "datajournalism".

Ein direkter Vorfahre des Datenjournalismus´ ist computer-assisted-reporting (CAR). Die computergestützte Recherche wird im englischsprachigen Raum seit den 60er Jahren praktiziert und auch an Journalismusschulen gelehrt. CAR sucht nach Auffällig- und Unregelmässigkeiten in großen Datensätzen, die als möglicher Anlass für eine tiefergehende Recherche dienen könnten.

Doch Datenjournalismus geht einen entscheidenden Schritt weiter: Er setzt auf Datensätze nicht nur als Recherchequelle, sondern macht die Daten zum zentralen Gegenstand der Geschichte und deren Präsentation. Dabei liegt er in der Schnittmenge von drei Bereichen: erstens visueller Journalismus oder Infografiken, zweitens multimediales und interaktives Storytelling und drittens investigativer Journalismus.

Datenjournalismus kann einen "Scoop" erzielen, einen Skandal aufdecken. Aber meist geht es um Hintergründiges: Die Aufbereitung und Darstellung komplexer Zusammenhänge, die in Schrift oder Tabellenform unüberschaubarer wären. Gelungener Datenjournalismus bietet dem Leser eine interaktiven Rechercheumgebung an, mit dem er sich ein eigenes Bild machen kann. Idealerweise stellt eine datenjournalistisches Werk auch noch die Rohdaten in maschinenlesbaren offenen Formaten an: So werden Zeitungen und andere Medien zu Agenten und Plattformen von Open Data.

Althergebracht: Vordigitaler Datenjournalismus



Datensätze sind seit jeher zentraler Bestandteil der Berichterstattung. Die purste Form sind reine Rohdaten, z.B. Lottozahlen. In allthergebrachtem Datenjournalismus, ob Börseninformationen oder Wetterkarten stecken schon viel Eigenschaften seiner modernen Form: Eine Unmenge von Daten, beispielsweise die zahlloser Wetterstationen, werden zusammengeführt, verrechnet und schließlich auf einer Karte visualisiert und somit verständlich aufbereitet.

Aber der wirkliche Vorreiter in Sachen Datenjournalismus ist in jüngster Zeit der Sport: Dass die Spielstände und Reihenfolge in der Liga uns in strukturierter Form als Tabelle präsentiert werden ist nichts Neues. Doch erfahren wir mittlerweile wie viele Meter ein Fußballer im Spiel gerannt ist und wie schnell er dabei im Durchschnitt war. Im Fernsehen gibt es als Beigabe Unmengen von zusätzlichen Informationen wie über die Zeit des Ballbesitzes oder den Aufenthalt in gegnerische Hälfte einer Mannschaft. Gemessen wir das zum Teil noch per Hand, aber auch schon durch automatische Erfassung per Kamera und Rechner.

Übrigens war eine der ersten Datenjournalistinnen überhaupt die Britin »Florence Nightingale« (1820 – 1910). Gemeinhin ist sie als Krankenschwester bekannt. Tatsächlich ist es ihr durch umfassende Auseinandersetzung mit den Statistiken zu den Sterberaten britischer Soldaten gelungen, für bessere Hygiene in den Lazaretten zu sorgen. Die politischen Entscheidern zu überzeugen gelang ihr nicht zuletzt dadurch, die komplexen Zusammenhänge durch selbstentwickelte Visualisierungsformen herunterzubrechen.

Erzählformen und Methoden



Klickstrecken, "Bewegtbild", Podcasts und so weiter sind nur Remixe althergebrachter Medienformate. Datenjournalismus dagegen setzt auf Datenbanken und Interaktivität, die nur im Browser oder einer App funktionieren können.

Eine klickbare Karte ist zwar interaktiv, aber noch lange kein wirklicher Datenjournalismus, genauso wenig wie ein Balken- oder Tortendiagramm. Denn ein enges Verständnis des Begriffs legt folgende Kriterien an:

  • Spielen ein oder mehrere Datensätze eine zentrale Rolle?
  • Ist das Angebot interaktiv in dem Sinne, dass es dem Leser erlaubt, die eigene Auseinandersetzung mit dem Datensatz zu suchen?
  • Werden Informationen also dynamisch anhand verschiedener vom Nutzer festgelegten Parameter (z.B. Zeitpunkt, Ausschnittsgröße, Standort, Suchbegriff, Wert) präsentiert?
  • Und als Bonus: Kann ich den Datensatz einsehen, herunterladen und gar unter einer freien Lizenz (Open Data) weiterverwenden?


Creative Commons License Dieser Text ist unter der Creative Commons Lizenz veröffentlicht. by/3.0/
Der Name des Autors/Rechteinhabers soll wie folgt genannt werden: by/3.0/ Autor: Lorenz Matzat für bpb.de

 

Dossier

Open Source

Open Source-Software ist das Paradox der Wissensgesellschaft: Programmierer verschenken ihr wertvollstes Gut – und begründen eine soziale Bewegung, die weltweit das Wissen befreien will. Weiter... 

Open Educational Resources “Komm! Ins Offene, Freund!”

Open Educational Resources “Komm! Ins Offene, Freund!”

Smartphones und Tablets - die Zukunft des Lernens? Im Interview plädiert der Präsident der bpb, Thomas Krüger, für einen sinnvollen Mix alter und neuer Medien, um zukünftiges Lernen erfolgreich zu gestalten. Eine immer größere Rolle werden - nicht nur für mobile Geräte - sog. "Open Educational Resources" spielen. Weiter...