Ein Besucher blickt auf das Rechenzentrum des CERN.

8.4.2011 | Von:

Zur Frage der Vergoogelung

Hin zu einer unkritisierbaren Maschine?

Die unkritisierbare Maschine

Für Medienwissenschaftler war eine der Fragen, wie der Begriff des Gatekeepers, des mächtigen Redakteurs, der die Geschichten für den Druck aussucht, im Lichte von Link-Netzen, die Rankings bestimmen, neu zu interpretieren sei, oder auch im Lichte der Suchverläufe, welche die eigenen Lieblingsseiten in personalisierten Suchen nach vorne reihen. Ohne algorithmische Kniffe und größere Neuerungen zu berücksichtigen, könnte eine geradlinige Diskussion über die neuen Formen des Gatekeepings an die Fälle von Seiten anknüpfen, die aus dem Index genommen werden. Der "Google-Guy", Matt Cutts, schreibt Blogs über sie und erzählt den Lesern von den "Webmaster best practices", dem Google-Leitfaden, der davor warnt, Webcrawler mit "Suchmaschinen-Spam" zu ködern, etwa in Form von Backdoor-Seiten. Von vielleicht größerer Wichtigkeit sind die spezifischen Einblicke in die Arbeit der Google-Roboter, die Cutts gibt. In Zusammenhang mit einem mother crawl aus dem Jahr 2006, dem so genannten bigdaddy, schreibt er, dass es Seiten gab, "wo unsere Algorithmen sehr wenig Vertrauen in die eingehenden und ausgehenden Links dieser Seite hatten. Dies war zum Beispiel bei übermäßigem gegenseitigen Verlinken der Fall, oder bei Links in Spam-verdächtige Umgebungen im Web [...]".(27) Die Rechnung, wonach ein Hyperlink eine Stimme ist, gilt nicht mehr, denn nicht alle Links sind von gleichem Wert. Das ist ein nützliches Korrektiv.

Die Erklärung, die sich auf übermäßiges gegenseitiges Verlinken bezieht, mag im folgenden Fall hilfreich sein. Als Beispiel für den wechselnden Wert von Links begannen eine Gruppe von Forschern und ich 2007 mit der Aufzeichnung von Google-Ergebnissen für die Suchanfrage "9/11", mit einem Fokus auf 911truth.org, einer Quelle, die in verschiedenen Zusammenhängen als Verschwörungstheorien-Seite bezeichnet wurde, auch nach den Tags, welche die Seite auf Delicio.us erhielt. Neben 911truth.org konzentriert sich die Arbeit auf die Rankings von zwei weiteren Seiten, die New York Times (nytimes.com), und die New Yorker Stadtregierung (nyc.gov). Von März 2007 bis zum Jahrestag von 9/11 ist 911truth.org kontinuierlich in den Top-10 der Ergebnisse.
Abbildung 2: Delicious tags für 911truth.org. Analyse von Michael Stevenson. Grafik von Digital Methods Initiative, Amsterdam 2008.Abbildung 2: Delicious tags für 911truth.org. Analyse von Michael Stevenson. Grafik von Digital Methods Initiative, Amsterdam 2008.



Die New York Times und die New Yorker Stadtregierung rangieren deutlich dahinter, auf Rang 50 bzw. 100. Eine der Absichten dieser Arbeit war es, die Rankings einer bestimmten Organisation für eine Anfrage aufzuzeigen und damit die Sichtweise auf Google-Ergebnisse zu verändern, aber auch über die kognitiven Veränderungen nachzudenken, die Google nach sich gezogen hat (Vergoogelungs-Studien haben daher auch ein Interesse an der Entwicklung der eigenen Vorstellungen darüber, was eine relevante Quelle ausmacht). Normalerweise sind die Top-10-Ergebnisse (oder Top 20, 30, 50, 100, je nach Präferenz) jene Ergebnisse, die man sich auch ansieht. Man denkt sich normalerweise nicht: Warum ist die New York Times in den Ergebnissen nicht vertreten? Wo ist die New Yorker Stadtregierung in den Ergebnissen für meine 9/11-Suche? Und sollte nicht auch die New Yorker Feuerwehr, die damals eine so wichtige Rolle spielte, vorkommen? Solche Fragen werden ausgeschlossen, denn stattdessen bilden die Google-Ergebnisse selbst den Rahmen des Relevanten.

Vor allem aber hat das Forschungsprojekt das plötzliche Verschwinden von 911truth.org aus den Ergebnissen dokumentiert. Etwa zehn Tage nach dem 11. September 2007 fiel 911truth.org von der Position unter den ersten fünf auf den zweihundertsten Platz, um danach völlig zu verschwinden und zwei Wochen später erneut in der üblichen Top-Position aufzutauchen.

Eine mögliche Erklärung dafür besteht darin, dass 911truth.org eine Franchise-Seite ist, deren Tochterseiten wie ny911truth.org, sf911truth.org und vancouver911truth.org routinemäßig mit ihr verlinken, und um den Jahrestag von 9/11 besonders viel verlinkt wurde, sodass es zu dem übermäßigen gegenseitigen Verlinken kam, von dem Matt Cutts spricht.
Abbildung 3: Eine Webseite verschwindet. Eine Webseite kommt zurück. Das Drama von 911truth.org in der Suchmaschine. Grafik von Issue Dramaturg, Govcom.org Foundation, Amsterdam 2007.Abbildung 3: Eine Webseite verschwindet. Eine Webseite kommt zurück. Das Drama von 911truth.org in der Suchmaschine. Grafik von Issue Dramaturg, Govcom.org Foundation, Amsterdam 2007.



Für meine Forscherkollegen und mich stellt sich die Frage, wie stabil die Quellenauswahl ist, die für Suchmaschinenergebnisse vorgenommen wird. Sind die Ergebnisse labil, also ist das, was man heute bekommt, anders, als die Ergebnisse von morgen? (Dass Ergebnisse sich im Laufe der Zeit ändern, ist für jene von Interesse, die den jeweils derzeitigen Stand einer Angelegenheit erforschen, nach Quellen und Akteuren, wie oben ausgeführt.)

Ich möchte mit einer besonders wichtigen Folge der Personalisierung schließen. Danny Sullivans Argument, dass personalisiertes Suchen jene Ergebnisse ausschließt, die allen Nutzern gemeinsam sind, möchte ich hinzufügen, dass die Personalisierung die Suchmaschine aus der Verantwortung befreit, denn "Schuld" oder Verantwortung für die Ergebnisse liegen dann zum Teil bei einem selbst. Die kritische Untersuchung von Suchergebnissen im Hinblick auf ihre informationspolitische Bedeutung wendet sich nach innen. Und für jene, die Google als Massenmedium sehen, wurde das früher fehlende Nutzerfeedback eingebaut.


Publikation zum Thema

Deep Search

Deep Search

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Buch deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite. Weiter...

Zum Shop

Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen.

Mehr lesen

Dialog

Die Netzdebatte

Netzdebatte ist das Debattenportal der Bundeszentrale für politische Bildung. Das Weblog greift Themen auf, die die Gesellschaft bewegen. Netzdebatte erklärt Hintergründe, bildet Positionen ab und bietet einen Ort zum Diskutieren.

Mehr lesen

spielbar.de

spielbar.de informiert über Computerspiele und erstellt pädagogische Beurteilungen. Pädagogen, Eltern und Gamer sind eingeladen, ihre eigenen Beurteilungen, Meinungen und Kommentare zu veröffentlichen.

Mehr lesen auf spielbar.de