Header Big Data

6.3.2015 | Von:
Viktor Mayer-Schönberger

Big Data - Zur Beschleunigung des menschlichen Erkenntnisprozesses

Annäherung an die Wirklichkeit

2014 berichteten Wissenschaftsmagazine in aller Welt von einem Fehler in Googles Grippevorhersage: Vor allem im Dezember 2012 habe sich das Unternehmen in der Vorhersage der Wintergrippe in den USA massiv verschätzt, und viel zu viele Fälle seien prognostiziert worden.[9] Was war passiert? Nach eingehender Fehleranalyse gestand Google ein, dass man das für die Grippevorhersage verwendete statistische Modell seit der Einführung im Jahr 2009 unverändert gelassen habe. Weil sich aber die Suchgewohnheiten der Menschen im Internet über die Jahre verändert hätten, sei die Vorhersage so deutlich daneben gegangen.

Google hätte das eigentlich wissen müssen. Denn viele andere Big-Data-Analysen seiner verschiedenen Dienste aktualisiert der Internetkonzern regelmäßig anhand neuer Daten. Eine aktualisierte Fassung der Vorhersage, basierend auf Daten bis 2011, ergab denn auch eine wesentlich genauere "Vorhersage" für Dezember 2012 und die folgenden Monate.

Dieser etwas peinliche Fehler von Google streicht eine weitere Besonderheit von Big Data heraus. Bisher versuchten wir, verallgemeinerungsfähige Erkenntnisse der Wirklichkeit zu gewinnen, die dem Anspruch genügen sollten, einfach und stets gültig zu sein. Dabei mussten wir aber oft die Wirklichkeit idealisieren. In den meisten Fällen reichte das auch aus. Indem wir nun aber antreten, die Wirklichkeit in all ihrer Detailreiche verstehen zu wollen, stoßen wir mit idealisierten Vorstellungen der Welt an Grenzen. Mit Big Data wird klar, dass wir mit idealisierten Vereinfachungen die Wirklichkeit nicht mehr in ihrer ganzen Vielfalt und Komplexität fassen können, sondern jedes Ergebnis einer Analyse nur als vorläufiges begreifen müssen.

So nehmen wir jeden neuen Datenpunkt dankbar an, in der Hoffnung, dass wir uns mit seiner Hilfe der Wirklichkeit ein kleines Stückchen weiter annähern. Und wir werden akzeptieren, dass uns abschließende Erkenntnis verborgen bleibt, nicht zuletzt, weil die Daten eben stets nur ein Abbild der Wirklichkeit und damit im Letzten unvollständig sind.

(Wirtschaftliches) Primat der Daten

Die Prämisse von Big Data ist, dass sich aus Daten Erkenntnisse über die Wirklichkeit gewinnen lassen. Konstitutiv für den Erkenntnisgewinn sind daher primär die Daten, nicht der Algorithmus. Auch das ist ein Unterschied zur "datenarmen" Vergangenheit. Denn bei wenigen Daten kommt dem Modell, dem Algorithmus, größeres Gewicht zu. Dieses muss die geringe Menge an Daten ausgleichen. Das hat Konsequenzen auch für die Verteilung informationeller Macht im Kontext von Big Data. In Zukunft werden weniger jene, die Daten bloß analysieren, Macht haben, als jene, die auch den Zugang zu Daten haben. Damit erhält auch das Unbehagen vieler Menschen gegenüber Organisationen und Unternehmen, die scheinbar immer größere Datenmengen sammeln und auswerten, ein sachliches Fundament.

Weil sich aus Daten Erkenntnisse schöpfen lassen, bestehen massive Anreize, immer mehr Aspekte unserer Wirklichkeit in Daten zu fassen, also – um einen Begriff zu prägen – die Wirklichkeit immer stärker zu "datafizieren". Immer kleinere, günstigere und genauere Sensoren helfen hier genauso wie eine immer noch zunehmende Rechenleistung der digitalen Werkzeuge, mit denen wir uns umgeben. In der Vergangenheit war nicht nur das Sammeln und Auswerten von Daten kostspielig, sondern auch das fortgesetzte Speichern der Daten. Aus diesem Grund wurde in der Regel nur so wenig wie nötig gesammelt, zudem wurden die Daten nach der Verwendung auch wieder gelöscht oder in Archiven vergessen. Diese Nutzung der Daten für ein bestimmtes Ziel bilden auch die bestehenden Datenschutznormen in der sogenannten Zweckbindung ab. Sinken die Kosten des Auswertens und Speicherns jedoch, dann ist es plötzlich sinnvoll, einmal gesammelte Daten vorrätig zu halten und zukünftig für neue Zwecke wiederzuverwenden. Das führt dazu, dass auch aus wirtschaftlicher Sicht massive Anreize bestehen, möglichst viele Daten scheinbar grundlos zu sammeln, zu speichern und so oft wie möglich einzusetzen. Denn dieses Datenrecycling erhöht die Effizienz der Datenwirtschaft.

Big Data ist ein mächtiges Werkzeug, die Wirklichkeit, in der wir leben, zu verstehen. Jene, die dieses Werkzeug effektiv einsetzen, ziehen daraus nachhaltige Vorteile. Dies bedeutet freilich auch Umverteilungen nicht nur informationeller Macht in unserer Gesellschaft – womit wir bei den Schattenseiten von Big Data angekommen sind.

Fußnoten

9.
Vgl. David Lazer/Ryan Kennedy/Gary King, The Parable of Google Flu: Traps in Big Data Analysis, in: Science, 343 (2014) 6176, S. 1203ff.
Creative Commons License

Dieser Text ist unter der Creative Commons Lizenz "CC BY-NC-ND 3.0 DE - Namensnennung - Nicht-kommerziell - Keine Bearbeitung 3.0 Deutschland" veröffentlicht. Autor/-in: Viktor Mayer-Schönberger für Aus Politik und Zeitgeschichte/bpb.de

Sie dürfen den Text unter Nennung der Lizenz CC BY-NC-ND 3.0 DE und des/der Autors/-in teilen.
Urheberrechtliche Angaben zu Bildern / Grafiken / Videos finden sich direkt bei den Abbildungen.


Publikation

Arbeitshilfe für die Jugendarbeit

Das jfc Medienzentrum Köln hat eine kostenlose Arbeitshilfe für die Jugendarbeit zum Thema Big Data entwickelt. Sie behandelt grundlegende Fragen zum Thema, stellt praktische Methoden für die Jugendarbeit vor und verschafft einen Überblick über weitere Informationen rund um das Thema.

Mehr lesen

Übersicht

Tools zur Verschlüsselung

Viele Daten, die online verschickt werden, können mitgelesen werden – von Dienst-Anbietern, Hackern oder Geheimdiensten. Digitale Spuren, die bei der Internetnutzung automatisch hinterlassen werden, sind nachvollziehbar und auswertbar. Das "SIN-Studio im Netz" hat in einer Broschüre Tipps und hilfreiche Tools zusammengestellt, die bei der Verschlüsselung von Daten und Absicherung eigener Geräte unterstützen sollen.

Mehr lesen

Datenbank

Medienkompetenz-Datenbank

Die Medienkompetenz-Datenbank bietet einen Überblick über die Vielfalt an länderübergreifenden, überregionalen und regionalen Angeboten zur Förderung der digitalen Medienkompetenz für Kinder, Jugendliche und Erwachsene. Es ist eine systematische Sammlung von nachhaltigen institutionalisierten nicht kommerziellen Angeboten, deren erklärtes Ziel es ist, Medienkompetenz als Kernkompetenz zu fördern.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Überwachung, Tracking, Datenschutz

Alarmismus, antiamerikanische Reflexe, Paranoia oder berechtigte Angst vor der Aushöhlung des Rechtsstaats und der Übermacht technisch hochgerüsteter Geheimdienste? Die Debatte zum Thema Überwachung und Datenschutz ist kompliziert. Netzdebatte vergleicht Positionen, erörtert Hintergründe und diskutiert Perspektiven.

Mehr lesen

Viktor Mayer-Schönberger bei den Bonner Gesprächen 2016

Viktor Mayer-Schönberger, der weltbekannte Wissenschaftler und Autor mehrerer Grundsatzwerke zu "Big Data" führte bei den Bonner Gesprächen mit seiner faszinierenden Vortragsweise in das herausfordernde Thema ein.

Jetzt ansehen

einfach Internet

einfach Internet: Online-Leitfäden in einfacher Sprache

Teilhabe mit Medien für alle. Die "Internet-Leitfäden in einfacher Sprache" sind für alle Menschen, die noch wenig Erfahrung mit dem Internet gemacht haben: Die ersten Schritte ins Netz, Facebook, YouTube, WhatsApp selbständig nutzen. Einfache Sprache soll dabei helfen, Informationen besser zu verstehen.

Mehr lesen

Dossier

Die Politik des Suchens

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Dossier deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Internet der Dinge

In ziemlich naher Zukunft werden die Dinge unseres Alltags miteinander kommunizieren und uns das Denken abnehmen. Unser Haus regelt dann selbstständig Wärme und Strom, unser Auto erkennt seinen Fahrer und lenkt uns autonom zur Arbeit. Wie das unser Leben gravierend verändern wird, zeigt der Schwerpunkt „Internet der Dinge“ auf Netzdebatte.

Mehr lesen

Mediathek

Evgeny Morozov: Big Data and You

Vortrag und Diskussion in englischer Sprache mit Evgeny Morozov in der neuen Staffel der Reihe Die Neue Weltbühne der Bundeszentrale für politische Bildung am 07.10.2013 in Berlin.

Jetzt ansehen

Schwerpunktthema "Die Netzdebatte"

Wer regiert das Netz?

Seit den Anfängen des Internets wird viel und gerne darüber diskutiert, wer im Netz das Sagen hat. Wer regelt den Zugang zum Netz? Wer bestimmt die Spielregeln? Im Schwerpunkt "Wer regiert das Netz" blickt Netzdebatte auf die aktuellen Entwicklungen und Debatten um die Netzinfrastruktur und Netzneutralität.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Open & Big Data

Open und Big Data - zwei Begriffe, deren Bedeutung für die Gesellschaft momentan sehr unterschiedlich verhandelt wird. Während Open Data in der öffentlichen Wahrnehmung zumeist für Offenheit und Transparenz steht, verbindet man mit Big Data riesige, undurchsichtige Datenmengen, die von Geheimdiensten wie Unternehmen unter Ausschluss der Öffentlichkeit verarbeitet werden. Was steckt tatsächlich dahinter?

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Brauchen wir die Vorratsdatenspeicherung?

Die Vorratsdatenspeicherung steht in Deutschland wieder zur Debatte. Auch ein Alleingang, ohne Abstimmung mit Brüssel, scheint nicht undenkbar. Zeit, sich ernsthaft mit dem Thema auseinanderzusetzen. Diskutieren sie mit, hier bei uns auf netzdebatte.bpb.de!

Mehr lesen