Ein Besucher blickt auf das Rechenzentrum des CERN.

8.4.2011 | Von:
Katja Mayer

Zur Soziometrik der Suchmaschinen

Ein historischer Überblick der Methodik

Katja Mayer zeichnet die Geschichte einer Methode nach, die heutigen Suchmaschinen zugrunde liegt: Die Bestimmung der Bedeutung von Veröffentlichungen durch Soziometrik. Sie zeigt auf, dass diese Methode nun in allen Bereichen der Informationsproduktion eingesetzt wird.

Amerikanische Wissenschaftler an der Universität von Indiana demonstrieren "Virtual Reality"-Brillen.Amerikanische Wissenschaftler an der Universität von Indiana demonstrieren "Virtual Reality"-Brillen. (© AP)

Der vorliegende Text (1) rekonstruiert die wechselvolle Geschichte einer Methode, die allen heutigen Suchmaschinen zugrunde liegt: Die Bestimmung der Autorität eines Datensatzes über seine Verlinkung – und die mit dieser Methode verbundenen sozialen Visionen. Ausgehend von Referenzen, die die Konstrukteure der Suchmaschinen selbst zur historischen Verankerung ihrer Techniken angeben, folge ich multiplen Spuren auf der Suche nach der so vorgenommenen Bestimmung von Autorität. Ich werde fündig in Konzepten zu sozialen Beziehungen und deren Wandel zu soziotechnischen Kommunikationen, die heute selbstverständlich erscheinen.


Ich bezeichne im Folgenden drei verwandte Ausrichtungen der Erfassung von sozialen Beziehungen.
  1. Die "soziometrische Revolution" propagierte seit den 1930er Jahren gruppenpsychologische Interventionen und Sichtbarmachungen von Einbettungen in soziale Strukturen als Mittel der Selbstermächtigung.(2) Dafür wurden mathematische Methoden entwickelt, die Autoritätsverteilungen direkt aus dem Gruppenverhalten, direkt aus der sozialen Beziehung selbst heraus erklären, verändern oder etablieren sollten, ohne auf bereits vorgefertigte Klassifikationschemata zurückzugreifen.

  2. In dieser Denktradition stehen bis heute bibliometrische Methoden zur Erschließung und Vermessung der Wissenschaften. Man verzichtete auf externe Referenzen zugunsten einer vermeintlich politisch neutralen Wissenschaft und erarbeitete selbst-referentielle Methoden zur Aggregation von objektiven Autoritäten – beispielsweise den impact factor des Science Citation Index –, welche als Maßstab bald selbst großen Einfluss auf ihr Messobjekt ausüben sollten. Mit fortschreitender Automation und Datenarchivierung wandelten sich solche Messmethoden erfolgreich zu Verhaltensanweisungen.

  3. Suchmaschinen stützen sich ebenfalls auf ein Verständnis von sozialen Beziehungen und Autorität, welches klare, qualitativ nachvollziehbare Referenzpunkte vermissen lässt. Als zentrale Vermittlungsinstanzen spiegeln sie nicht nur bestehende Autorität wider, sondern stellen diese auch mit her und machen diese Selbstbezüglichkeit sichtbar. Doch diese Strategie findet sich heute nicht nur in Suchmaschinen, sondern ist Teil einer allgemeinen Tendenz der sozialen Optimierung.

Regelung der Autorität – Legitimation des Wissens

Googles Erfolgsgeschichte begann an der Universität Stanford, als Sergey Brin und Larry Page Ende der 1990er Jahre "Ordnung ins Web" bringen wollten.(3) Im Gegensatz zu den damals den Markt beherrschenden Suchmaschinen, welche die Relevanz von Suchergebnissen nach der Frequenz und Platzierung von Suchworten in den gefunden Webseiten bemaßen, sollte Google mit einem anderen Ansatz die relevantesten Dokumente erkennen. Die Bewertung einer Website wurde auf Basis ihrer Verlinkungsstruktur vorgenommen. Das so genannte PageRank-Verfahren bewertet eine Webseite mittels der auf sie verweisenden Links. Doch die eingehenden Links werden nicht gleichwertig gezählt, sondern wiederum nach der Bedeutsamkeit der Herkunftsseite gewichtet. Somit ist ein Verweis einer als wichtig eingestuften Webseite besonders wertvoll. Die PageRank-Werte von eingehenden Links werden vererbt. Jede indexierte Webseite im Google Archiv wird also mit einem unabhängig von der Suchanfrage bestehenden PageRank-Wert versehen.
    PageRank nimmt eine objektive Bewertung der Wichtigkeit von Websites vor. Dabei wird eine Gleichung mit über 500 Millionen Variablen und zwei Milliarden Ausdrücken berechnet. Anstatt die direkten Links zu zählen, interpretiert PageRank einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A. Anschließend bewertet PageRank die Wichtigkeit einer Seite anhand der erzielten Voten.(4)
So formuliert Google selbst das Verfahren. Was hier als Votum benannt und damit relativ unpräzise gehalten ist, findet man in einem Paper von Jon Kleinberg, Spitzname "rebel king", etwas erhellender ausgedrückt: "Hyperlinks encode a considerable amount of latent human judgment, and we claim that this type of judgment is precisely what is needed to formulate a notion of authority." Noch etwas genauer schreibt er:
    Specifically, the creation of a link on the www represents a concrete indication of the following type of judgment: the creator of page p, by including a link to page q, has in some measure conferred authority on q. Moreover, links afford us the opportunity to find potential authorities purely through the pages that point to them. (5)
Auf der Suche nach Ordnungsmechanismen für die Ergebnisse der Suchmaschinen stellte Kleinberg das Konzept der "hubs and authorities" vor. Er entwickelte ein dem PageRank ähnliches Verfahren, das er "hypertext-induced topic selection" (HITS) nannte. In Hyperlinks findet sich also ein gewisser Anteil latenten, menschlichen Urteils, welches als Autorität zur Bewertung der Wichtigkeit einer Seite herangezogen werden kann. Wer einen Link setzt, hat sich das überlegt und positiv für diese Referenz entschieden.

So wie Page und Brin nennt auch Kleinberg die bibliometrische Zitationsanalyse als direkte Quelle seiner Inspiration. Er macht auch auf das sozialwissenschaftliche Feld der Soziometrie aufmerksam, im speziellen auf ein von Katz im Jahre 1953 entwickeltes Verfahren zur Berechnung des Status in einer sozialen Gruppe,(6) und auf den von Hubbell weiterentwickelten Ansatz zur Identifizierung von Cliquen.(7) Fast ein halbes Jahrhundert zuvor waren also bereits Verfahren entwickelt worden, an die jetzt direkt angeschlossen werden konnte. Sie stammten aus jener sozialwissenschaftlichen Perspektive, die sich seit langem mit sozialen Netzwerken auseinandersetzte und die in den 1970er Jahren als "Soziale Netzwerkanalyse" bekannt wurde.


Publikation zum Thema

Deep Search

Deep Search

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Buch deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite. Weiter...

Zum Shop

Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen.

Mehr lesen

Dialog

Die Netzdebatte

Netzdebatte ist das Debattenportal der Bundeszentrale für politische Bildung. Das Weblog greift Themen auf, die die Gesellschaft bewegen. Netzdebatte erklärt Hintergründe, bildet Positionen ab und bietet einen Ort zum Diskutieren.

Mehr lesen

spielbar.de

spielbar.de informiert über Computerspiele und erstellt pädagogische Beurteilungen. Pädagogen, Eltern und Gamer sind eingeladen, ihre eigenen Beurteilungen, Meinungen und Kommentare zu veröffentlichen.

Mehr lesen auf spielbar.de