Was sind offene Daten?
Welche rechtlichen und technischen Voraussetzungen müssen geschaffen sein, damit sich Daten 'offen' nennen dürfen? Was für Lizenzen sind notwendig, um Daten offen nutzen zu dürfen?
Der Begriff "offene Daten" (englisch Open Data) ist ein einfaches Konzept: Daten sind dann "offen", wenn sie durch jedermann und für jegliche Zwecke genutzt, weiterverarbeitet und weiterverbreitet werden können. Dieses Konzept ist im akademischen Bereich nicht neu und ähnelt den Konzepten von Open Access, Open Content und Open Source.
Der Begriff offene Daten schließt Daten aus Wissenschaft und Forschung mit ein, dennoch wird er heute oft synonym für "Open Government Data" verwendet, also für "offene Daten der öffentlichen Verwaltung" oder kurz "offene Behördendaten". Offene Behördendaten spielen eine wichtige Rolle im Prozess der Öffnung von Regierung und Verwaltung, der als Open Government bezeichnet wird.
Open Government steht für einen kulturellen Wandel im Verhältnis von Bürger und Staat, der zu mehr Transparenz, mehr Teilhabe und einer intensiveren Zusammenarbeit führen kann. Offene Daten sind Teil und notwendige Voraussetzung für diesen Prozess der Öffnung. Durch den freien Zugang der Allgemeinheit zu offenen Behördendaten kann politisches Handeln transparent und nachvollziehbar werden. Das kann zu mehr Rechenschaft und Pflichtbewusstsein der Amtsträger gegenüber der Allgemeinheit führt, was wiederum zu einer stärkeren Akzeptanz von Regierungshandeln führen und das Vertrauen der Bevölkerung in ihre Regierung und Verwaltung stärken kann. Transparentes Regierungs- und Verwaltunghandeln ist außerdem das beste Mittel gegen Korruption. Im Effekt können offene Daten also die Demokratie nachhaltig stärken.
Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren jedes Jahr große Menge an Daten. Dazu gehören Umwelt- und Wetterdaten, Geodaten, Verkehrsdaten, Haushaltsdaten, Statistiken, Publikationen, Protokolle, Gesetze, Urteile und Verordnungen. Diese Daten dienen der Erfüllung staatlicher Aufgaben und sind von öffentlichem Interesse.
Offene Daten sind nicht nur gut für die Demokratie, sie bergen auch enormes Potential für Innovationen. Liegen diese Daten als offene Daten vor, können sie von Bürgern, Nichtregierungsorganisationen, Hochschulen und Firmen genutzt, weiterverarbeitet, veredelt und weiterverbreitet werden. So können neue Auswertungen und Analysen, Anwendungen, Produkte und Dienstleistungen, Geschäftsmodelle und Produktionsketten entstehen.
Was unterscheidet offene Daten von anderen Daten?
Nicht alle Daten sind offene Daten. Es gibt Daten, die prinzipiell nicht für die Veröffentlichung vorgesehen sind, dazu gehören zum einen personenbezogene Daten und bestimmte Daten, die aus Sicherheitsgründen per Gesetz nicht öffentlich sind. Für alle andern Daten stellt sich die Frage: Warum sind sie eigentlich nicht als offene Daten frei zugänglich? Es gibt Daten, die zwar veröffentlicht sind, aber nicht als offene Daten gelten können, weil sie etwa unter einer Lizenz stehen, die eine Weiterverarbeitung nicht gestattet oder weil sie in einem Format vorliegen, das eine Weiterverarbeitung erschwert oder verhindert. In einer internationalen Debatte wurde in den letzten Jahren der Versuch unternommen, den Begriff "offene Daten" zu definieren. Diese Definition kann wie folgt zusammengefasst werden:Daten sind dann offen, wenn es keine rechtlichen, technischen oder sonstigen Kontrollmechanismen gibt, die den Zugang, die Weiterverarbeitung und die Weiterverbreitung dieser Daten einschränken. Der Zugang, die Weiterverarbeitung und die Weiterverbreitung soll jedermann und zu jeglichem Zweck, auch kommerziellem, ohne Einschränkungen und Diskriminierung und ohne Zahlung von Gebühren möglich sein.Daten müssen also in technischer wie rechtlicher Hinsicht offen sein, um als "offene Daten" gelten zu können. Warum ist das so wichtig? Reicht es nicht aus, wenn zum Beispiel eine Behörde eine Information auf Anfrage per Post zustellt oder als PDF auf ihrer Webseite veröffentlicht? Die Antwort ist ein klares "Nein". Bei offenen Daten geht es um das explizite Recht und die Möglichkeit, die Daten nicht nur einsehen, sondern auch weiterverarbeiten und weiterverbreiten zu können. Das Potential von offenen Daten kann nur realisiert werden, wenn die Daten in offenen maschinenlesbaren Formaten, unter offenen Lizenzen und kostenfrei zugänglich sind.
In den letzten Jahren wurden von international anerkannten Organisationen Prinzipien und Empfehlungen entwickelt, die Regierungen und Verwaltungen dabei helfen sollen, ihre Datenbestände für die Allgemeinheit zu öffnen. An erster Stelle sind die "8 Prinzipien für offene Behördendaten" zu nennen, die 2007 im Kalifornischen Sebastopol von 30 Experten unter Leitung von Tim O´Reilly und Carl Malamud erarbeitet wurden. Diese Prinzipien wurden 2010 von der Sunlight Foundation in einer überarbeiteten und erweiterten Fassung als "10 Prinzipien zum Öffnen von Regierungsinformationen." veröffentlicht. Sie gelten seither als Standard.
Die 10 Prinzipien zum Öffnen von Regierungsinformationen benennen die wichtigsten Grundsätze, die bei der Veröffentlichung von Daten berücksichtigt werden sollten. Die Grundsätze sind: Vollständigkeit, Primärquelle, Aktualität, Zugänglichkeit, maschinelle Lesbarkeit, Nichtdiskriminierung, Verwendung von offenen Standards, offene Lizenzierung, Dauerhaftigkeit und niedrige Nutzungskosten (so die deutsche Übersetzung der 10 Prinzipien zum Öffnen von Regierungsinformationen.)
Doch was bedeuten diese Prinzipien für die Praxis?
Um staatliche Stellen dabei zu unterstützen ihre Daten zu öffnen und anzubieten, hat das World Wide Web Consortium (W3C) einen Leitfaden entwickelt. Dabei werden drei Schritte zur Veröffentlichung staatlicher Daten empfohlen:- Erster Schritt: Rohdaten online veröffentlichen.
- Zweiter Schritt: Die veröffentlichten Daten in einem Online-Verzeichnis sortieren.
- Dritter Schritt: Daten für Mensch und Maschine lesbar machen und miteinander vernetzen.
Fünf-Sterne-Modell
- kein Stern : Daten im Web (Format egal), ohne offene Lizenz
- 1 Stern : Daten im Web (Format egal) mit offener Lizenz
- 2 Sterne : Daten in strukturiertem Format (z.B. Excel)
- 3 Sterne : Daten in strukturiertem, nicht proprietärem Format (z.B. CSV statt Excel)
- 4 Sterne : Verwendung von eindeutigen URLs, so dass Datensätze verlinkt werden können
- Sterne : Verlinkung der eigenen Daten mit anderen Daten, um Kontext herzustellen