Wordle für Open Data Dossier
1 | 2 | 3 | 4 Pfeil rechts

Was sind offene Daten?


26.10.2011
Welche rechtlichen und technischen Voraussetzungen müssen geschaffen sein, damit sich Daten 'offen' nennen dürfen? Was für Lizenzen sind notwendig, um Daten offen nutzen zu dürfen?

Creative Commons - eine mögliche Lizenz für offene Daten.Creative Commons - eine mögliche Lizenz für offene Daten. Lizenz: cc by/3.0/ (CC)
Im Gegensatz zu Informationen handelt es sich bei Daten oft um nicht-textliches Material, wie Karten und Satellitenaufnahmen, um so genannte "Rohdaten", wie Wetter-, Geo- und Umweltdaten oder um Daten, wie sie zum Beispiel in der Forschung anfallen, etwa um Genome, medizinische Daten, mathematische und wissenschaftliche Formeln.

Der Begriff "offene Daten" (englisch Open Data) ist ein einfaches Konzept: Daten sind dann "offen", wenn sie durch jedermann und für jegliche Zwecke genutzt, weiterverarbeitet und weiterverbreitet werden können. Dieses Konzept ist im akademischen Bereich nicht neu und ähnelt den Konzepten von Open Access, Open Content und Open Source.

Der Begriff offene Daten schließt Daten aus Wissenschaft und Forschung mit ein, dennoch wird er heute oft synonym für "Open Government Data" verwendet, also für "offene Daten der öffentlichen Verwaltung" oder kurz "offene Behördendaten". Offene Behördendaten spielen eine wichtige Rolle im Prozess der Öffnung von Regierung und Verwaltung, der als Open Government bezeichnet wird.

Open Government steht für einen kulturellen Wandel im Verhältnis von Bürger und Staat, der zu mehr Transparenz, mehr Teilhabe und einer intensiveren Zusammenarbeit führen kann. Offene Daten sind Teil und notwendige Voraussetzung für diesen Prozess der Öffnung. Durch den freien Zugang der Allgemeinheit zu offenen Behördendaten kann politisches Handeln transparent und nachvollziehbar werden. Das kann zu mehr Rechenschaft und Pflichtbewusstsein der Amtsträger gegenüber der Allgemeinheit führt, was wiederum zu einer stärkeren Akzeptanz von Regierungshandeln führen und das Vertrauen der Bevölkerung in ihre Regierung und Verwaltung stärken kann. Transparentes Regierungs- und Verwaltunghandeln ist außerdem das beste Mittel gegen Korruption. Im Effekt können offene Daten also die Demokratie nachhaltig stärken.

Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren jedes Jahr große Menge an Daten. Dazu gehören Umwelt- und Wetterdaten, Geodaten, Verkehrsdaten, Haushaltsdaten, Statistiken, Publikationen, Protokolle, Gesetze, Urteile und Verordnungen. Diese Daten dienen der Erfüllung staatlicher Aufgaben und sind von öffentlichem Interesse.

Offene Daten sind nicht nur gut für die Demokratie, sie bergen auch enormes Potential für Innovationen. Liegen diese Daten als offene Daten vor, können sie von Bürgern, Nichtregierungsorganisationen, Hochschulen und Firmen genutzt, weiterverarbeitet, veredelt und weiterverbreitet werden. So können neue Auswertungen und Analysen, Anwendungen, Produkte und Dienstleistungen, Geschäftsmodelle und Produktionsketten entstehen.

Was unterscheidet offene Daten von anderen Daten?



Nicht alle Daten sind offene Daten. Es gibt Daten, die prinzipiell nicht für die Veröffentlichung vorgesehen sind, dazu gehören zum einen personenbezogene Daten und bestimmte Daten, die aus Sicherheitsgründen per Gesetz nicht öffentlich sind. Für alle andern Daten stellt sich die Frage: Warum sind sie eigentlich nicht als offene Daten frei zugänglich? Es gibt Daten, die zwar veröffentlicht sind, aber nicht als offene Daten gelten können, weil sie etwa unter einer Lizenz stehen, die eine Weiterverarbeitung nicht gestattet oder weil sie in einem Format vorliegen, das eine Weiterverarbeitung erschwert oder verhindert. In einer internationalen Debatte wurde in den letzten Jahren der Versuch unternommen, den Begriff "offene Daten" zu definieren. Diese Definition kann wie folgt zusammengefasst werden:
Daten sind dann offen, wenn es keine rechtlichen, technischen oder sonstigen Kontrollmechanismen gibt, die den Zugang, die Weiterverarbeitung und die Weiterverbreitung dieser Daten einschränken. Der Zugang, die Weiterverarbeitung und die Weiterverbreitung soll jedermann und zu jeglichem Zweck, auch kommerziellem, ohne Einschränkungen und Diskriminierung und ohne Zahlung von Gebühren möglich sein.
Daten müssen also in technischer wie rechtlicher Hinsicht offen sein, um als "offene Daten" gelten zu können. Warum ist das so wichtig? Reicht es nicht aus, wenn zum Beispiel eine Behörde eine Information auf Anfrage per Post zustellt oder als PDF auf ihrer Webseite veröffentlicht? Die Antwort ist ein klares "Nein". Bei offenen Daten geht es um das explizite Recht und die Möglichkeit, die Daten nicht nur einsehen, sondern auch weiterverarbeiten und weiterverbreiten zu können. Das Potential von offenen Daten kann nur realisiert werden, wenn die Daten in offenen maschinenlesbaren Formaten, unter offenen Lizenzen und kostenfrei zugänglich sind.

In den letzten Jahren wurden von international anerkannten Organisationen Prinzipien und Empfehlungen entwickelt, die Regierungen und Verwaltungen dabei helfen sollen, ihre Datenbestände für die Allgemeinheit zu öffnen. An erster Stelle sind die "»8 Prinzipien für offene Behördendaten«" zu nennen, die 2007 im Kalifornischen Sebastopol von 30 Experten unter Leitung von Tim O´Reilly und Carl Malamud erarbeitet wurden. Diese Prinzipien wurden 2010 von der Sunlight Foundation in einer überarbeiteten und erweiterten Fassung als "»10 Prinzipien zum Öffnen von Regierungsinformationen.«" veröffentlicht. Sie gelten seither als Standard.

Die 10 Prinzipien zum Öffnen von Regierungsinformationen benennen die wichtigsten Grundsätze, die bei der Veröffentlichung von Daten berücksichtigt werden sollten. Die Grundsätze sind: Vollständigkeit, Primärquelle, Aktualität, Zugänglichkeit, maschinelle Lesbarkeit, Nichtdiskriminierung, Verwendung von offenen Standards, offene Lizenzierung, Dauerhaftigkeit und niedrige Nutzungskosten (»so die deutsche Übersetzung der 10 Prinzipien zum Öffnen von Regierungsinformationen«.)

Doch was bedeuten diese Prinzipien für die Praxis?



Um staatliche Stellen dabei zu unterstützen ihre Daten zu öffnen und anzubieten, hat das World Wide Web Consortium (W3C) einen »Leitfaden« entwickelt. Dabei werden drei Schritte zur Veröffentlichung staatlicher Daten empfohlen:
  1. Erster Schritt: Rohdaten online veröffentlichen.
  2. Zweiter Schritt: Die veröffentlichten Daten in einem Online-Verzeichnis sortieren.
  3. Dritter Schritt: Daten für Mensch und Maschine lesbar machen und miteinander vernetzen.
Diese Empfehlungen sind denkbar einfach und technisch nicht schwierig umzusetzen. Sie sollen es Behörden leicht machen, mit der Öffnung ihrer Datenbestände anzufangen: Alle Daten, die behördenintern in digitaler Form vorliegen, sollen so, wie sie sind, als "Rohdaten" veröffentlicht werden. Dieser erste Schritt macht die Daten zugänglich und kann von jeder Behörde schon heute, ohne großen Aufwand und ohne große Kosten umgesetzt werden. Im zweiten Schritt werden die Daten sortiert und über einen Katalog erschlossen, was die Suche erleichtert. Im dritten Schritt werden die Daten in strukturierte und maschinenlesbare Formate überführt und miteinander vernetzt.Dahinter steckt die Einsicht, dass nicht alle Daten von heute auf morgen mit dem höchstmöglichen Grad an Offenheit entsprechend der 10 Prinzipien zum Öffnen von Regierungsinformationen zugänglich gemacht werden können. Deshalb wird ein schrittweises Vorgehen empfohlen. Um die Qualität von veröffentlichten Daten zu messen, hat Sir Tim Berners-Lee, Erfinder des World Wide Web, ein "»Fünf-Sterne-Modell«" vorgeschlagen, das den Grad der Offenheit von Datensätzen klassifiziert.

Fünf-Sterne-Modell

  • kein Stern : Daten im Web (Format egal), ohne offene Lizenz
  • 1 Stern : Daten im Web (Format egal) mit offener Lizenz
  • 2 Sterne : Daten in strukturiertem Format (z.B. Excel)
  • 3 Sterne : Daten in strukturiertem, nicht proprietärem Format (z.B. CSV statt Excel)
  • 4 Sterne : Verwendung von eindeutigen URLs, so dass Datensätze verlinkt werden können
  • Sterne : Verlinkung der eigenen Daten mit anderen Daten, um Kontext herzustellen
Das Fünf-Sterne-Modell ist kaskadierend: Den zweiten Stern kann nur bekommen, wer bereits die Voraussetzungen für den ersten Stern erfüllt. Auffallend dabei ist, dass die erste Prämisse keine technische ist, sondern eine offene Lizenz voraussetzt. Also: Ohne offene Lizenzen keine offenen Daten.


Creative Commons License Dieser Text ist unter der Creative Commons Lizenz veröffentlicht. by/3.0/
Der Name des Autors/Rechteinhabers soll wie folgt genannt werden: by/3.0/ Autor: Daniel Dietrich für bpb.de

 

Dossier

Open Source

Open Source-Software ist das Paradox der Wissensgesellschaft: Programmierer verschenken ihr wertvollstes Gut – und begründen eine soziale Bewegung, die weltweit das Wissen befreien will. Weiter... 

Open Educational Resources “Komm! Ins Offene, Freund!”

Open Educational Resources “Komm! Ins Offene, Freund!”

Smartphones und Tablets - die Zukunft des Lernens? Im Interview plädiert der Präsident der bpb, Thomas Krüger, für einen sinnvollen Mix alter und neuer Medien, um zukünftiges Lernen erfolgreich zu gestalten. Eine immer größere Rolle werden - nicht nur für mobile Geräte - sog. "Open Educational Resources" spielen. Weiter... 

zum Fragebogen >

Ihre Meinung ist uns wichtig


Vielen Dank für Ihren Besuch von bpb.de!

Wir wollen unseren Internetauftritt verbessern - und zwar mit Ihrer Hilfe. Dazu laden wir Sie herzlich zu einer kurzen Befragung ein. Sie dauert etwa 10-12 Minuten. Die Befragung führt das unabhängige Marktforschungsinstitut SKOPOS für uns durch.

Bitte unterstützen Sie uns mit Ihrer Teilnahme. Ihre Meinung ist uns sehr wichtig!

Ihre Bundeszentrale für politische Bildung

Information zum Datenschutz und zur Datensicherheit


Als unabhängiges Marktforschungsinstitut führt SKOPOS Institut für Markt- und Kommunikationsforschung GmbH & Co. KG im Auftrag der Bundeszentrale für politische Bildung diese Befragung durch.

Zur Durchführung der Befragung erhebt SKOPOS Ihre IP-Adresse. Diese wird umgehend anonymisiert und getrennt von den Befragungsdaten verarbeitet, deshalb ist eine Identifizierung von Personen nicht möglich. Weitere personenbeziehbare oder personenbezogene Daten werden nicht erhoben.

Die Befragung entspricht den gesetzlichen Bestimmungen zum Datenschutz und den Richtlinien des Berufsverbandes Deutscher Markt- und Sozialforscher e.V. sowie der Europäischen Gesellschaft für Meinungs- und Marketingforschung. Es erfolgt keine Weitergabe an Dritte.

Weitere Informationen und Kontaktdaten finden Sie hier.