Netzdebatte Logo

Michael Hörz am 20.02.2014

Offenheit in der Probephase - über das Potential von Open Data

Offene Daten sind nützlich. Richtig verarbeitet können sie für mehr Transparenz sorgen oder von Entwicklern genutzt werden, um intelligente Anwendungen zu entwickeln. In manchen Ländern wie den USA ist die Offenlegung von Verwaltungsdaten daher bereits gesetzlich festgelegt. In Deutschland (noch) nicht. Michael Hörz sagt, es braucht auch hierzulande eine verbindliche Open Data Strategie.

Neonschilder OpenOffen Daten sind eine Chance für staatliche Institutionen wie Bürger/-innen. Lizenz: cc by/2.0/de (CC, Antti T. Nissien)

Offenheit in der Erprobungsphase

Bereits im Mai 2013 legte US-Präsident Barack Obama fest, dass Daten von Regierungsbehörden künftig standardmäßig offen veröffentlicht werden müssen (“open by default”). Dies betrifft nicht-persönliche Verwaltungsdaten, die jeder Bürger uneingeschränkt nutzen darf, etwa Zahlen zu Gesundheitsausgaben oder digitales Kartenmaterial.

Der Nutzen aus offenen Daten ist ihre leichte Verarbeitbarkeit und ein möglicher Erkenntnisgewinn – Bürger wie Unternehmen können sie verwenden, auswerten und etwa sehen, wie hoch Regierungsausgaben im Detail sind. Wie weit diese Transparenz gehen kann, zeigt die Stadt Chicago, die sämtliche städtische Gehälter mit Namen veröffentlicht. Wichtig ist dabei immer die Frage: Wie können die Daten nutzbar gemacht werden? Beispiele dafür sind visuelle Aufbereitungen öffentlicher Haushalte, von Unfall-Schwerpunkten oder auch Anwendungen, die mit Hilfe von Miet-, Schul- und weiteren Daten Eltern ermöglichen, den bestmöglichen Wohnort für die ganze Familie zu finden.

Wichtige Voraussetzung für die Verarbeitung offener Daten ist dabei auch das Format: Bislang wurden Daten häufig als PDFs veröffentlicht, weil Menschen sie leicht verstehen können. Wenn jedoch Computer aus den Daten schlau werden sollen, stoßen sie dabei schnell an ihre Grenzen. Daher müssen offene Daten auch immer maschinenlesbar sein, also in einem Format wie Excel vorliegen.

Open Data - in Deutschland noch in den Kinderschuhen

In Deutschland liegt zurzeit kein Plan vor, der mit dem US-Vorhaben vergleichbar wäre. Einzelne Bundesländer wie Berlin, Hamburg oder Bremen waren in den vergangenen Jahren Vorreiter, nach Daten anderer Ländern suchen Nutzer auf Datenportalen bislang vergeblich. Gebündelt sind die offenen Daten bei GovData.de, das im Frühjahr 2013 an den Start ging. Auf der Internetplattform finden sich Daten von Bundeseinrichtungen, Ländern und auch kleinen Städten wie etwa Moers. Das Portal ist noch in der Erprobungsphase – Ende 2013 wurde es bewertet und soll nach einigen Verbesserungen in den Regelbetrieb übergehen.

Tatsächlich ist auch ganz Deutschland in Sachen Open Data in einer Erprobungsphase. Manche Daten liegen nur in einem schlecht nutzbaren Format vor, andere sind schlecht beschrieben und tauchen daher kaum in den Suchergebnissen auf. Damit sich das ändert braucht es zentrale Festlegungen für eine Open-Data-Infrastruktur in Deutschland. Also Rahmenbedingungen die bestimmen, welche Daten wichtig sind, in welchen Formaten und mit welchen Beschreibungen sie minimal veröffentlicht werden müssen.

Hoffnung macht grundsätzlich die Open-Data-Charter der G8-Staaten, die festlegt, dass bis 2015 eine festgelegte Zahl von Datensätzen offen werden muss. Diese sind allesamt wichtige Daten, etwa Haushalte, digitale Karten oder Unternehmensregister. Unter anderem einigten sich die Staaten auch darauf, bis wann sie welche Schritte unternommen haben müssen. Bis Ende 2013 sollte eigentlich ein Ablaufplan für jedes Land stehen, in Deutschland hat sich die Umsetzung wegen der Koalitionsverhandlungen über den Jahreswechsel verzögert.

Die Verwaltungsdaten häufen sich – wie Open Data zu Big Data wird

Die Zahl der Daten auf Portalen und innerhalb von Behörden wächst immer weiter. Nicht immer wird man aus ihnen auf den ersten Blick schlau, einige Datensätze können mehrere Millionen Einträge haben. Dazu braucht es Big-Data-Werkzeuge, die etwa Unternehmen zur Auswertung enormer Datenmengen verwenden. Big Data können erweiterte Zugriffsdaten einer Website sein oder Detaildaten zum Gesundheitssystem. Sie sind im Gegensatz zu Open Data nicht frei zugänglich, da sie häufig nicht anonymisiert sind. Aus solchen Daten lassen sich teilweise in Echtzeit Muster und Zusammenhänge erkennen. Möglich machen das leistungsfähige Rechner und Software die hilft, die Daten „lesbar“ zu machen.

Der Online-Streamingdienst Netflix etwa nutzte seine ausführlichen Nutzerdaten, um die Erfolgschancen einer selbst produzierten Serie einzuschätzen. Im Gegensatz zu repräsentativ erhobenen Einschaltquoten konnte Netflix auf die genauen Abrufzahlen für jedes einzelne Video der Website zugreifen und so erkennen, welche Inhalte besonders gut bei den Nutzern ankommen. Eine Konsequenz daraus war die von Netflix produzierte Serie „House of Cards“, die zu einem großen Erfolg für das Portal wurde. Für Netflix sind die Daten ein wertvolles Gut, deswegen geben sie diese auch nicht heraus: Über die Nutzungszahlen der Serie ist nichts zu erfahren.

Big Data ist im Umfeld von Open Data nicht unproblematisch: Niemand dürfte etwas dagegen haben, etwa aus unzähligen Wetterdaten interaktive Karten zu programmieren, die Wetter-Rück- und Ausblicke bis auf Ebene von Ortsteilen ermöglichen. Andererseits halten Behörden viele Daten bisher nebeneinander vor, die mit Hilfe der Big-Data-Technologie nun in Zusammenhang gebracht werden können. Die Technologie ermöglicht durch das Kombinieren vieler Daten eine De-Anonymisierung an sich anonymer Daten – Merkmale lassen sich durch Verkettung wieder zuordnen. Eine Nutzungsmöglichkeit, die zum Zeitpunkt der Datenerhebung zumeist noch gar nicht angedacht war.

Damit weckt Big Data insbesondere bei Kriminalisten Begehrlichkeiten. Sie hoffen darauf, sich unterschiedlichste Quellen zu erschließen, um Verbrechen schon zu erkennen, ehe sie begangen werden. Derartiges verstößt zurzeit aber noch gegen deutsche und europäische Datenschutzregeln wie die Zweckbindung von Daten und die informationelle Selbstbestimmung.

Die Konsequenzen von Big Data für den Einzelnen können groß sein. Was es braucht ist Aufklärung darüber, welche Daten wirklich erhoben werden und wie sie weiterverarbeitet werden. Für eine bessere Verkehrsregelung oder medizinische Fortschritte würden viele ihre Daten hergeben, für Werbung dagegen nicht.

Zum Weiterlesen:
  • "Big Data und Datenschutz" - Eine Studie des Handelsblatt Instituts über den Umgang der Deutschen mit persönlichen Daten und die Konsequenzen für den Einsatz von Big Data
  • "Was ist Big Data?" - Eine Studie des Landeszentrum für Datenschutz in Schleswig-Holstein

i

Michael Hörz

Michael Hörz lebt und arbeitet in Berlin. Er ist Redakteur, Journalist und Dozent für Internationale Medieninformatik an der Hochschule für Technik und Wirtschaft in Berlin. Vor allem interessiert er sich für alles, was mit Daten zu tun hat: Daten finden, aufbereiten, visualisieren, kontextualisieren und mit ihnen zu erzählen.

http://www.michael-hoerz.de

Creative Commons License

Dieser Text ist unter der Creative Commons Lizenz veröffentlicht. by-nc-nd/3.0/
Urheberrechtliche Angaben zu Bildern / Grafiken / Videos finden sich direkt bei den Abbildungen.


Ihr Kommentar:

(*) Diese Felder sind Pflichtfelder

Ihr Kommentar wird von der Redaktion geprüft und dann freigeschaltet



Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen.

Mehr lesen

Big Data ist Realität und Big Data wird unser Leben verändern. Über Big Data wachsen Medienbildung und politische Bildung untrennbar zusammen. Diese Website liefert Material für die Bildungsarbeit: Mit exemplarischen Thesen und herausragenden Vertreter_innen dieser Disziplinen, Einführungen, Definitionen, Bild- und Tondokumenten und vor allem Handreichungen für die Praxis.

Mehr lesen

netzdebatte.bpb.de in Social Media

Debatte

Bedingungsloses Grundeinkommen

Was wäre, wenn jede_r von uns jeden Monat vom Staat einen festen Betrag aufs Konto überwiesen bekäme - ohne etwas dafür tun zu müssen? Das ist, vereinfacht gesagt, die Idee eines Bedingungslosen Grundeinkommens (BGE). Die Idee ist kontrovers, denn sie kratz an einigen elementaren Fragen: Ist der Mensch von Natur aus faul oder fleißig? Wie sehr vertrauen wir unseren Mitmenschen wirklich? Was ist der eigentliche Sinn von Arbeit? Woran misst sich eigentlich der Wert von Arbeit?

Mehr lesen

Debatte

Robotersteuer

Machen uns Roboter in Zukunft überflüssig? Oder schaffen sie neue Freiräume? Gewiss ist, dass die Automatisierung der Arbeit, aktuell unter dem Schlagwort Industrie 4.0, unsere Arbeitswelt verändern wird. Wie Politik, Gesellschaft und Wirtschaft darauf reagieren, ist allerdings noch offen. Diskutiert wird im Zuge dessen auch über die Einführung einer sogenannten Robotersteuer, die die befürchteten negativen sozialen Effekte abmildern soll. Wir haben zwei Experten zum Thema, um ihre Einschätzung gebeten.

Mehr lesen