Ein Besucher blickt auf das Rechenzentrum des CERN.

8.4.2011 | Von:

Der zweite Index

Suchmaschinen, Personalisierung und Überwachung

Google setzt eine Vielfalt von Methoden ein, um Daten seiner Nutzer zu sammeln. Das Click-Tracking ermöglicht es Google schon lange, jeden Klick, den irgendjemand auf einem seiner Server macht, aufzuzeichnen. Log-Files speichern jeden Zugriff auf jeden Google-Server, wobei stets Grunddaten wie die IP-Adresse der Nutzer, Ort, Datum, Zeit, Zeitzone, Sprache, Betriebssystem und Browser aufgezeichnet werden (die so genannte "Standard-Loginformation"). Auch darüber hinausgehende Informationen werden an Google übermittelt, und zwar mit Hilfe von Java-Scripts und Web-Beacons, die in die Google-Seiten integriert sind.(6) Cookies werden auf allen Google-Seiten verwendet. Ursprünglich sollten diese Cookies mit dem Jahr 2038 ablaufen. 2007 wurde das System jedoch so geändert, dass die derzeit eingesetzten Cookies nur mehr eine Laufzeit von zwei Jahren haben – außer man verwendet Google in dieser Zeit, denn in diesem Fall läuft das Cookie weitere zwei Jahre, womit das Cookie so gut wie kein Ablaufdatum mehr besitzt. Cookies, die Information an Google übermitteln, werden nicht nur auf Googles eigenen Seiten eingesetzt, sondern auch auf scheinbar nicht mit Google verbundenen Seiten, die AdSense, AdWords, DoubleClick-Werbung oder das Statistik-Tool Google Analytics verwenden. Die meisten Nutzer, und sogar die meisten Web-Administratoren wissen nichts von den technischen Implikationen dieser Dienste, d.h. dass diese Cookies dem Sammeln von Daten über das Verhalten der Nutzer auf vielen Nicht-Google-Seiten dienen. Neben diesen recht undurchsichtigen Technologien, die nur der technisch versierten Google-Klientel bekannt sind, gibt es auch Datensätze, die die Nutzer selbst anlegen. Die Nutzer füllen freiwillig Formulare aus, um ein Konto zu eröffnen, womit teilweise sehr persönlichen Details preisgegeben werden. Genau durch diese Zusammenführung von Informationen von einer Vielzahl von Diensten sowie von Drittparteien ist Google in der Lage, dieses umfangreiche Wissen über seine Nutzer zu sammeln, welches das Unternehmen so mächtig und so attraktiv für Werbekunden macht.

Für analytische Zwecke können wir drei Arten von Profilen unterscheiden, die zusammen ein umfassendes Profil für jeden Nutzer ergeben. Er wird zuerst als "Wissensperson" beobachtet, mit seinen Interessen und Informationsnutzungsmustern, in einem zweiten Schritt als "soziale Person", wobei seine realen Identitäten, Kontakte und die Kommunikation mit anderen Nutzern ausgewertet werden. Der letzte Datensatz erfasst den Nutzer schließlich als "physische Person" im realen Raum.

Die folgende Übersicht ist keineswegs eine vollständige Auflistung der Google-Dienste, allein schon deswegen nicht, weil sich ihre Anzahl ständig vergrößert. Wir gehen jedoch davon aus, dass in der Zukunft hinzugefügte Dienste den Umfang dieser drei Profile noch weiter vergrößern werden.

Profil 1: Die Wissensperson

Der einfache Google-Suchdienst hat von seinen Nutzern nie verlangt, ein Konto zu eröffnen oder von sich aus persönliche Informationen bekannt zu geben. Die Standard-Loginformation wird jedoch immer im Hintergrund aufgenommen. Darüber hinaus erfassen die Google-Server Informationen, die mit der Suchfunktion selbst zu tun haben: Die Suchanfrage, die Sprach-Voreinstellungen, den Ländercode in der Top-Level-Domain (ob also z.B. Google.com oder Google.at genutzt wird), die Ergebnisseiten der Suchmaschine und die Zahl der Suchergebnisse, sowie auch Einstellungen wie safe search (die nicht jugendfreien Content blockieren soll), oder zusätzliche Suchoptionen wie Dateityp und Region.

Mehrere andere Dienste können der gleichen Kategorie zugeordnet werden, erstens weil sie es ihren Nutzern ermöglichen, Web-Content von Drittparteien zu suchen – seien es Webseiten, Zeitschriften, Bücher, Bilder oder Produkte – und zweitens, weil Google sie dafür einsetzt, ähnliche Datensätze über seine Nutzer zu sammeln. Diese Dienste umfassen Google Directory, Image Search, News Search, News Archive Search, Google Scholar, Google Books, Google Video, Blog Search, das von Google gehostete LIFE Foto-Archiv, oder Google Product Search (früher als Froogle bekannt).

Hal Roberts vom Berkman Center for Internet & Society an der Harvard Universität schreibt:
    Es ist sogar wahrscheinlich, dass diese Sammlung von Suchbegriffen, IP-Adressen und Cookies die größte und sensibelste existierende Datensammlung ist, sowohl online als auch offline. Egal ob Google sich nun entscheidet, den relativ einfachen Schritt zu tun, der notwendig ist, um aus dieser Sammlung von Suchdaten eine Datenbank mit personenbezogenen Daten herzustellen, es hat jedenfalls die Möglichkeit, personenbezogene Daten aus dieser Sammlung abzurufen, wann immer es will (oder von einer Regierung, einem Eindringling, einem unzufriedenen Mitarbeiter usw. dazu genötigt wird).(7)
Dienste wie AdSense, AdWords, AdPlanner oder Analytics (8) haben Google dabei geholfen, weit über die eigentlichen Google Seiten hinaus zu expandieren: Google Analytics kann auf jeder Webseite kostenlos installiert werden. Google darf aber im Gegenzug Informationen von diesen Seiten sammeln. Schätzungen zufolge ist diese "Software in achtzig Prozent der häufig besuchten deutschsprachigen Internetseiten integriert".(9) Das gleiche Prinzip liegt auch den Werbesystemen Googles zugrunde. Die Besucher von Nicht-Google-Seiten wissen für gewöhnlich nicht, dass ihre Online-Aktivitäten dennoch von Google aufgezeichnet werden können, denn "früher konnten Web-Firmen die Aktivitäten ihrer Kunden nur auf ihren eigenen Seiten überwachen. In den letzten Jahren haben die Internet-Riesen allerdings ihre Reichweite vergrößert, indem sie als Vermittler fungieren, die auf tausenden von Webseiten Anzeigen schalten und damit die Aktivitäten der Menschen auf viel mehr Seiten verfolgen können."(10)

Chrome, der neue Web-Browser von Google und ein gutes Beispiel für die Entwicklung der Google-Wolke, muss ebenfalls als Werkzeug zur Herstellung des Wissensprofils von Nutzern gesehen werden, wobei ein zusätzlicher Vorteil darin liegt, dass die Unterscheidung zwischen dem Online- und Offline-Wissen des Nutzers verwischt wird. "Das Design von Chrome schließt die Lücke zwischen dem Desktop und dem so genannten ‚Cloud Computing´. Mit einem einzigen Knopfdruck ermöglicht es Chrome, einen Desktop, ein Menü oder eine Verknüpfung zu jeder beliebigen Webseite oder Web-Applikation anzulegen, womit die Trennung zwischen Online-Information und Information auf dem PC verwischt wird."(11) Die Omnibox-Funktion von Chrome, eine Adressleiste, die wie ein Google-Suchfenster mit automatischer Vorschlagsfunktion funktioniert, zeichnet jedes eingegebene Zeichen auf, auch wenn die Enter-Taste nicht gedrückt wird.(12) Auf heftige Kritik antwortete Google, dass die über Tastenanschläge (in Verbindung mit der IP-Adresse) aufgezeichneten Daten innerhalb von 24 Stunden anonymisiert würden.(13) Bedenken wurden auch bezüglich der Verlaufs-Suchfunktion von Chrome geäußert, die sensible Nutzerdaten wie persönliche Finanz- und Gesundheitsdaten auf verschlüsselten Seiten (https://) indiziert und speichert.(14)

Neue Dienste werden eingeführt, um systematisch Daten zu erfassen, die bisher nicht im Nutzerprofil enthalten waren. Dabei können die Grunddaten eines Nutzers mit Informationen über praktisch jeden Aspekt seiner Informationsbedürfnisse angereichert und kombiniert werden: Google-Server überwachen und zeichnen auf, wonach die Nutzer suchen (Google Search, Google Toolbar, Google Web History), welche Webseiten sie besuchen (Google Chrome, Web Accelerator), welche Dateien (Dokumente, E-Mails, Chats, Surf-Verlauf) sie auf ihren Computern haben (Google Desktop), was sie lesen und mit Lesezeichen versehen (Google Books einschließlich personalisierter Bibliothek, Google Notebook, Google Bookmarks, Google Reader), was sie in ihren E-Mails (Gmail) sowie in Arbeitsdateien und persönlichen Dokumenten online (Google Docs) und offline (Google Desktop), in Diskussionsgruppen (Google Groups), Blogs (Blogger) oder Chats (Google Talk) schreiben, was sie übersetzen, und welche Sprachen dabei beteiligt sind (Google Translate).

Profil 2: Die soziale Person

Mit der Entstehung des Web 2.0 wurde klar, dass Nutzer nicht nur einzelne Menschen auf der Suche nach Information sind, sondern auch enge oder lose soziale Bindungen eingehen, sowohl online als offline. Im Zuge des Wachstums der Google-Dienste wurde das Portfolio um personalisierte Programme erweitert, welche die Nutzer als soziale Wesen erfassen.

Das Eröffnen eines Google-Kontos schafft den Nutzern Zugang zu einer Vielzahl von Diensten, von denen die meisten nicht von "außerhalb" des Kontos verfügbar sind. Wenn man sich entscheidet, das eigene Profil zu bearbeiten, dann umfassen die persönlichen Daten, die Google dem Konto entnimmt, nicht nur die Zahl der Logins, das Passwort und die E-Mail-Adresse, sondern auch den Wohnort, den realen Vor- und Familiennamen, den nick name, die Adresse, weitere E-Mail-Adressen, Telefonnummern, Datum und Ort der Geburt, frühere Wohnorte, den Beruf, gegenwärtige und frühere Beschäftigungsverhältnisse, eine kurze Biografie, Interessen, Fotos, sowie Links zu Online-Fotoalben, Social-Networking-Profilen und persönlichen Webseiten.

Darüber hinaus hat Google früher unabhängige Seiten wie YouTube und Blogger gekauft, womit deren Kontoinformationen automatisch "übersiedelt" wurden, während überdies weitere soziale Netzwerke wie orkut und Lively, Chat, Calendar, Mobiltelefonie und andere Dienste eingeführt wurden.

Neben dem Monitoring des gesamten Inhalts der Kommunikation (E-Mails, Postings, verschickte und erhaltene Textmitteilungen) speichern Dienste wie Google Groups, Gmail, Google Talk, Friends Connect oder orkut-Store alle externen Texte, Bilder, Fotos, sowie Video- und Audio-Dateien, die hochgeladen werden, aber auch Kontaktlisten und Gruppen, die von einem Nutzer verwaltet werden, Nachrichten oder Themen, die verfolgt wurden, persönliche Seiten, die von einem Nutzer erstellt oder bearbeitet werden, und die vorgenommenen Wertungen. Google-Server zeichnen auch auf, mit wem sich Nutzer vernetzen (orkut), wo, wann und warum sie Freunde und berufliche Kontakte treffen, welche Freunde auf Einladungen reagierten, welche E-Mail-Adressen diese Kontakte haben (Google Calendar), wo sie online einkaufen, welche Produkte sie suchen (Catalog Search, Product Search, Google Store), welche Kreditkarten sie verwenden sowie die Gültigkeitsdauer und Sicherheitsnummern dieser Karten; wo sie einkaufen, ihre Versandadressen, wie viel sie einkaufen und zu welchem Preis, von wem sie etwas kaufen, und auf welche Art die Zahlung erfolgte (Google Checkout, Google Video). Darüber hinaus werden auch Informationen über Aktienportfolios, d.h. die gewählten Aktien, die Anzahl der Aktien eines Nutzers, sowie Datum, Zeit und der Preis des Kaufs aufgenommen (Google Finance).


Publikation zum Thema

Deep Search

Deep Search

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Buch deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite. Weiter...

Zum Shop

Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen.

Mehr lesen

Dialog

Die Netzdebatte

Netzdebatte ist das Debattenportal der Bundeszentrale für politische Bildung. Das Weblog greift Themen auf, die die Gesellschaft bewegen. Netzdebatte erklärt Hintergründe, bildet Positionen ab und bietet einen Ort zum Diskutieren.

Mehr lesen

spielbar.de

spielbar.de informiert über Computerspiele und erstellt pädagogische Beurteilungen. Pädagogen, Eltern und Gamer sind eingeladen, ihre eigenen Beurteilungen, Meinungen und Kommentare zu veröffentlichen.

Mehr lesen auf spielbar.de