Lernparcours des jfc Köln

13.3.2018 | Von:
jfc Medienzentrum

Was kann Datenanalyse leisten?

(2) Big Data Analytics

Möglich wird Datenanalyse durch immer leistungsfähigere, vernetzte Speicher und Rechner. Hier laufen Algorithmen, die riesige Datenmengen durchwühlen. Algorithmen können Daten sortieren und vergleichen und so Muster finden. Die Muster, die Algorithmen finden, können nach bestimmten Kriterien zusammengestellt werden: es entstehen Profile, Dossiers oder Prognosen über Gruppen, Personen und andere Zusammenhänge (z.B. das Wetter, Ähnlichkeiten von Bildern, Kaufverhalten). Auf Basis dieser Auswertungen fallen Entscheidungen, teilweise automatisch, z.B. bei Werbeanzeigen, teilweise stützen sich Menschen auf diese Informationen, z.B. ArbeitgeberInnen, RichterInnen, ÄrztInnen.

Entscheiden nach Datenlage

Möglich wird Datenanalyse durch immer leistungsfähigere, vernetzte Speicher und Rechner. Hier laufen Algorithmen, die riesige Datenmengen durchwühlen. Algorithmen können Daten sortieren und vergleichen und so Muster finden. Die Muster, die Algorithmen finden, können nach bestimmten Kriterien zusammengestellt werden: es entstehen Profile, Dossiers oder Prognosen über Gruppen, Personen und andere Zusammenhänge (z.B. das Wetter, Ähnlichkeiten von Bildern, Kaufverhalten). Auf Basis dieser Auswertungen fallen Entscheidungen, teilweise automatisch, z.B. bei Werbeanzeigen, teilweise stützen sich Menschen auf diese Informationen, z.B. ArbeitgeberInnen, RichterInnen, ÄrztInnen.
Analytics GraphikAnalytics (© jfc)



Auswertungsverfahren optimieren sich selbst

Auswertungsverfahren werden immer differenzierter: Verschiedene Datenquellen werden „quer“ zueinander in Beziehung gesetzt. Lernende Algorithmen beziehen systematisch diejenigen Faktoren ein, die die besten Korrelationen für das gewünschte Ziel erzeugen. Sie finden so auch statistische Hinweise auf Zusammenhänge, die Menschen durch Beobachtung nicht gefunden hätten, z.B. Indikatoren für eine Grippeepidemie.

i

Definition Algorithmus

„Der Begriff umschreibt eine Folge von Anweisungen, mit denen ein bestimmtes Problem gelöst werden kann. Die Folge von Anweisungen findet sich häufig in Software wieder und liegt im Quellcode vor.“

https://praxistipps.chip.de/was-ist-ein-algorithmuseinfach-erklaert_41355

„Algorithmen sind im Grunde Kochrezepte, die dem Computer sagen, was für Operationen er durchführen soll, um auf eine Eingabe die richtige Antwort zu geben. “


https://www.algo.informatik.tu-darmstadt.de/algorithmik/was-ist-algorithmik/

Korrelationen liefern Wahrscheinlichkeiten - sagen aber nichts über Ursachen

Eis, Sonne und BootKausalität und Korrelation (© jfc)
Korrelationen sind statistische Werte, die miteinander in Beziehung stehen. So kann z.B. das Suchverhalten einer Person auf Google mit bestimmten Käufen auf Amazon korrelieren, auch Bilddateien können nach Korrelationen untersucht werden. Was statistisch erhärtet ist, erscheint uns als objektive Wahrheit. Korrelationen weisen zwar auf mögliche Zusammenhänge hin, können diese aber nicht im Mindesten erklären.


Ursachen werden nicht erkannt.
Menschen werden aufgrund ihrer statistisch wahrscheinlichen Neigungen einsortiert und beurteilt – und nicht aufgrund ihrer tatsächlichen Motive und Einstellungen.

Die Chronik lebt: mit Daten der Vergangenheit wird Zukunft beeinflusst

WeckerUhr
Da die Vorhersage auf unseren vergangenen Handlungen beruht, ist es für die Datensammler wichtig, sie nicht zu vergessen: „Wir können unserer eigenen Vergangenheit immer weniger entkommen. Die Verhaltensvorhersagen durch Big Data beeinflussen z.B. die Auswahl der Informationen und Produkte, die uns angeboten werden, die Jobs, die wir bekommen können, die Partnerwahl, wenn wir Datingportale zu Hilfe nehmen. Sie gefährden also insbesondere unsere Handlungs- und Entscheidungsfreiheit als eigenständige Subjekte.“

www.klicksafe.de/themen/medienethik/privatsphaere-und-big-data/kontrolle-ueber-die-eigene-identitaet

Prognosen bauen mit an der Realität, die sie vorhersagen

Grafik zu Big Data PrognosenSelbsterfüllende Prognose (© jfc)
Algorithmen können auch deshalb erfolgreich erscheinen, weil sie eine Self-fulfilling Prophecy in Gang setzen. Wenn z.B. Richter Straftäter zu Gefängnis verurteilen, weil eine Datenanalyse sie für rückfallgefährdet hält – und Verurteilte rückfällig werden, weil sie inhaftiert werden...

Statistische Wahrscheinlichkeit ersetzt so das Verstehen und Gestalten einer offenen Realität. Die Chance, sich anders zu verhalten als vorhergesagt, verringert sich.

Vergleich verschiedener BildauflösungenPixelrelation (© jfc)

Große Datenmengen gleichen Ungenauigkeiten aus und vernebeln den Einzelfall

Statistik-Lehrbücher sind voll mit Beispielen von Fehlschlüssen auf der Basis von Korrelationen. Im Big-Data-Zeitalter scheint Korrelation aber immer häufiger „gut genug“: Wenn man nicht mehr mit Stichproben arbeiten muss, sondern SEHR viele Daten hat, („n=all“ ) dann wird Ungenauigkeit von Einzeldaten unproblematischer.

Aussagen nur über Korrelationen reichen dann häufiger aus, um statistisch gegründete Entscheidungen zu treffen, auch wenn die tatsächlichen Zusammenhänge nicht nachvollzogen werden. (Vgl. Mayer-Schönberger/Cukier, S. 19-72)

Exakte Profile und Prognosen auch ohne personenbezogene Daten

Hand wischt auf SmartphoneProfilbildung (© jfc)
Die geschützten personenbezogenen Daten (Name, Adresse, Geburtsdatum) werden seltener gebraucht, um genaue Profile zu erstellen. Metadaten, z.B. Verbindungsdaten, Freundesnetze, Likes, GPS Daten, Browserverläufe, Kaufdaten etc. reichen völlig aus. Allein auf Basis von „anonymen“ Daten werden wir in Profile und Prognosen einbezogen und sind mit deren Anwendungen konfrontiert: z.B. politische Beeinflussung oder Predictive Policing.


Kindertracking

Ein Kind auf dem SchulwegSchulkind (© jfc)
Im großen Stil werden Daten von Kindern und Jugendlichen gesammelt, z.B. über ihr Lern,- Sozial-, und Spielverhalten, ihre Interessen und Probleme. Eltern „tracken“ ihre Kinder mit der elektronischen Nanny und der Anbieter trackt mit.

Das digitale Kinderzimmer, der „Schutzranzen“ und „Learning Analytics“ (Messung von Lernverhalten) nimmt zu. Unsere Freiheit als Subjekt wird eingeschränkt. Soll eine Rechenschwäche im 2. Schuljahr, Übergewicht mit Zwölf, intensives Gamen mit dreizehn Jahren darüber entscheiden, ob jemand später einen Job bekommt?

i

Der "Browser Fingerprint"

Definition

„Unter Begriffen wie „Browser Fingerprint“ oder Device Fingerprint wird seit einigen Jahren die eindeutige Wiedererkennung von NutzerInnen anhand der Eigenschaften des benutzten Web-Browsers und Gerätes diskutiert – ohne dass dabei Cookies auf den Rechnern der NutzerInnen gespeichert werden müssen.“

(Vgl. Wolfie Christl: Kommerzielle digitale Überwachung im Alltag, Studie im Auftrag der Bundesarbeitskammer Wien, November 2014)

Eine Studie, im Magazin Nature veröffentlicht (2013) zeigt, dass vier aus Aufenthaltsort und Zeitpunkt bestehende Datenpunkte genügen, um 95% der NutzerInnen eindeutig zu identifizieren. In einem Forschungsprojekt der US-Bürgerrechtsorganisation Electronic Frontier Foundation (EFF) konnten 99,1% der untersuchten Browser-NutzerInnen auf Basis ihres Browser Fingerprints korrekt wiedererkannt werden.


Tipps zur Vertiefung

Methoden
  • Filterblase
    Die Teilnehmenden erfahren, dass Filterblasen im digitalen als auch im analogen Leben allgegenwärtig sind, sie aber gerade im Hinblick auf das Internet die Möglichkeit haben, unterschiedliche Sichtweisen kennenzulernen und auszuprobieren. Für Jugendliche ab 12 Jahre.
Video


Publikation

Arbeitshilfe für die Jugendarbeit

Das jfc Medienzentrum Köln hat eine kostenlose Arbeitshilfe für die Jugendarbeit zum Thema Big Data entwickelt. Sie behandelt grundlegende Fragen zum Thema, stellt praktische Methoden für die Jugendarbeit vor und verschafft einen Überblick über weitere Informationen rund um das Thema.

Mehr lesen

Übersicht

Tools zur Verschlüsselung

Viele Daten, die online verschickt werden, können mitgelesen werden – von Dienst-Anbietern, Hackern oder Geheimdiensten. Digitale Spuren, die bei der Internetnutzung automatisch hinterlassen werden, sind nachvollziehbar und auswertbar. Das "SIN-Studio im Netz" hat in einer Broschüre Tipps und hilfreiche Tools zusammengestellt, die bei der Verschlüsselung von Daten und Absicherung eigener Geräte unterstützen sollen.

Mehr lesen

Datenbank

Medienkompetenz-Datenbank

Die Medienkompetenz-Datenbank bietet einen Überblick über die Vielfalt an länderübergreifenden, überregionalen und regionalen Angeboten zur Förderung der digitalen Medienkompetenz für Kinder, Jugendliche und Erwachsene. Es ist eine systematische Sammlung von nachhaltigen institutionalisierten nicht kommerziellen Angeboten, deren erklärtes Ziel es ist, Medienkompetenz als Kernkompetenz zu fördern.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Überwachung, Tracking, Datenschutz

Alarmismus, antiamerikanische Reflexe, Paranoia oder berechtigte Angst vor der Aushöhlung des Rechtsstaats und der Übermacht technisch hochgerüsteter Geheimdienste? Die Debatte zum Thema Überwachung und Datenschutz ist kompliziert. Netzdebatte vergleicht Positionen, erörtert Hintergründe und diskutiert Perspektiven.

Mehr lesen

Viktor Mayer-Schönberger bei den Bonner Gesprächen 2016

Viktor Mayer-Schönberger, der weltbekannte Wissenschaftler und Autor mehrerer Grundsatzwerke zu "Big Data" führte bei den Bonner Gesprächen mit seiner faszinierenden Vortragsweise in das herausfordernde Thema ein.

Jetzt ansehen

einfach Internet

einfach Internet: Online-Leitfäden in einfacher Sprache

Teilhabe mit Medien für alle. Die "Internet-Leitfäden in einfacher Sprache" sind für alle Menschen, die noch wenig Erfahrung mit dem Internet gemacht haben: Die ersten Schritte ins Netz, Facebook, YouTube, WhatsApp selbständig nutzen. Einfache Sprache soll dabei helfen, Informationen besser zu verstehen.

Mehr lesen

Dossier

Die Politik des Suchens

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Dossier deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Internet der Dinge

In ziemlich naher Zukunft werden die Dinge unseres Alltags miteinander kommunizieren und uns das Denken abnehmen. Unser Haus regelt dann selbstständig Wärme und Strom, unser Auto erkennt seinen Fahrer und lenkt uns autonom zur Arbeit. Wie das unser Leben gravierend verändern wird, zeigt der Schwerpunkt „Internet der Dinge“ auf Netzdebatte.

Mehr lesen

Mediathek

Evgeny Morozov: Big Data and You

Vortrag und Diskussion in englischer Sprache mit Evgeny Morozov in der neuen Staffel der Reihe Die Neue Weltbühne der Bundeszentrale für politische Bildung am 07.10.2013 in Berlin.

Jetzt ansehen

Schwerpunktthema "Die Netzdebatte"

Wer regiert das Netz?

Seit den Anfängen des Internets wird viel und gerne darüber diskutiert, wer im Netz das Sagen hat. Wer regelt den Zugang zum Netz? Wer bestimmt die Spielregeln? Im Schwerpunkt "Wer regiert das Netz" blickt Netzdebatte auf die aktuellen Entwicklungen und Debatten um die Netzinfrastruktur und Netzneutralität.

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Open & Big Data

Open und Big Data - zwei Begriffe, deren Bedeutung für die Gesellschaft momentan sehr unterschiedlich verhandelt wird. Während Open Data in der öffentlichen Wahrnehmung zumeist für Offenheit und Transparenz steht, verbindet man mit Big Data riesige, undurchsichtige Datenmengen, die von Geheimdiensten wie Unternehmen unter Ausschluss der Öffentlichkeit verarbeitet werden. Was steckt tatsächlich dahinter?

Mehr lesen

Schwerpunktthema "Die Netzdebatte"

Brauchen wir die Vorratsdatenspeicherung?

Die Vorratsdatenspeicherung steht in Deutschland wieder zur Debatte. Auch ein Alleingang, ohne Abstimmung mit Brüssel, scheint nicht undenkbar. Zeit, sich ernsthaft mit dem Thema auseinanderzusetzen. Diskutieren sie mit, hier bei uns auf netzdebatte.bpb.de!

Mehr lesen