BUNDESTAGSWAHL 2021 Mehr erfahren
Ein Besucher blickt auf das Rechenzentrum des CERN.

11.4.2011 | Von:
Bernhard Rieder

Demokratisierung der Suche?

Von der Kritik zum gesellschaftlich orientierten Design

Vorschläge und Perspektiven

Im Kontext des gesellschaftlich orientierten Designs richtet sich das normative Denken notwendigerweise nach Möglichkeiten der Anwendung. Ausgehend von den drei im vorhergehenden Abschnitt definierten Grundsätzen werden im Folgenden Vorschläge behandelt, die über die gängige Forderung nach mehr Transparenz hinausgehen. Mehr Information über die innere Funktionsweise von Suchmaschinen würde die Kritik der Ranking-Mechanismen sicher vereinfachen, aber schon jetzt existiert eine relativ gute Vorstellung davon, wie Suchmaschinen ihre Ergebnisse produzieren.(41) Kritiker fordern mehr Transparenz, um die soziale Kontrolle zu fördern und willkürliche Machtausübung zu unterbinden. Das Problem mit der gegenwärtigen Konfiguration von Suchmaschinen ist indessen nicht einfach ihr Missbrauchs-Potenzial, sondern vielmehr die einseitige Ausrichtung auf Beliebtheit und Komfort. Die folgenden Vorschläge zielen darauf ab, die Konfiguration von Suchmaschinen an den Grundsätzen der Vielfalt, der Autonomie und des Zugangs auszurichten, die in der Praxis ein zusammen hängendes Ganzes bilden.

Regulierung und Anreiz

Während es unbestritten ist, dass Suchmaschinen von enormem gesellschaftlichen Nutzen sind, so ist die Vorherrschaft einer einzigen Firma auf dem globalen Suchmarkt doch ein reales Problem. Auch wenn man Google keine Verfehlungen vorwirft, ist alleine die Konzentration der Macht über die Sichtbarkeit im Web etwas, was zu Bedenken Anlass geben sollte. Aus der Sicht des Modells des öffentlichen Raums ist das Web Teil eines Mediensystems, und wenn Suchmaschinen ähnliche Funktionen erfüllen wie Medien, dann kann man argumentieren, dass die Maßnahmen, die in westlichen Demokratien getroffen wurden, um Medienkonzentration zu verhindern, auch hier anzuwenden sind. Auch ohne böswillige Manipulationen von Suchergebnissen profitiert Google Inc. enorm von seinem privilegierten Status als Gatekeeper. Die großen Mengen an Daten, die die Nutzer bei den verschiedenen Diensten hinterlassen, stellen eine Marktinformation von unschätzbarem Wert dar, die entweder verkauft oder zur Optimierung der Unternehmensstrategie eingesetzt werden kann. Prominent platzierte Links auf der Startseite lenken die Aufmerksamkeit der Suchenden auf die ganze Produktpalette des Unternehmens, was bei der Einführung eines neuen Dienstes von großem Vorteil ist, und durch die vollständige Kenntnis des Ranking-Verfahrens hat Google Inc. die beste SEO, die sich eine Firma wünschen kann. Wie Kawaguchi und Mowshowitz schreiben, muss sichergestellt werden, dass es Alternativen gibt, und aus politischer Sicht gibt es dafür zwei Strategien: Staaten können entweder dem dominanten Akteur Beschränkungen auferlegen, oder den Wettbewerb fördern.(42)

Was die erste Möglichkeit angeht, gibt es in den meisten Demokratien Telekom-Gesetze, welche – manchmal in genauen Prozentwerten – die Marktanteile definieren, die von einer einzelnen Firma kontrolliert werden dürfen, aber auch Kapitalverflechtungen regulieren – etwa die Übernahme einer Zeitung durch ein TV-Netzwerk. Während sich solche Regelungen nicht eins zu eins auf den Suchmarkt übertragen lassen, ist es der Bedeutung nach durchaus möglich. Der FTC-Fall von 2002 hat bereits eine Verbindung zwischen der Suche und der Mediengesetzgebung hergestellt, und die Arbeitsgruppe "Artikel 29" der EU-Kommission untersucht die Datenschutzpraktiken von Suchmaschinen.(43) Der Wettbewerbsfall EU vs. Microsoft aus dem Jahr 2004 könnte ebenso als Richtschnur dienen, besonders im Hinblick auf die Ausnutzung einer beherrschenden Position auf dem Suchmarkt zur Kontrolle anderer Märkte. Allerdings sollte man sich angesichts der Komplexität solcher Fälle nicht allein auf einschränkende Maßnahmen verlassen. Die Förderung des Wettbewerbs auf dem Suchmarkt ist möglicherweise eine bessere Strategie.

Auch hier gibt es einen Präzedenzfall im Kontext der Mediengesetzgebung. Besonders europäische Länder gewähren Zeitungsunternehmen beträchtliche Unterstützung, entweder durch direkte finanzielle Zuwendungen (Österreich, Frankreich, Spanien, u.a.), oder durch Nachlässe auf Steuern oder Zustellgebühren (Deutschland, Großbritannien, Schweiz, u.a.). Das französische Quaero-Projekt (€ 99 Mio.) und das deutsche Theseus-Projekt (€ 90 Mio.) sind Pionierprojekte, die Suchmaschinen-Forschung mit öffentlichen Geldern betreiben. Diese Summen sind, wenngleich sie von anderen Konsortiums-Partnern noch verdoppelt werden, natürlich weit von dem entfernt, was den großen Suchmaschinenbetreibern zur Verfügung steht, und die Projekte zielen in Wirklichkeit nicht auf Universalanwendungen ab, sondern auf Multimedia-Suchen (Quaero) und semantische Zugänge (Theseus). Es ist bedauerlich, dass diese Mittel nicht direkt in den Bereichen eingesetzt werden, die in einer liberalen Demokratie zentral sind. Da wir das Web als heterogene Infrastruktur wahrnehmen, könnten wir vielleicht zu dem Schluss kommen, dass "egalitärere und umfassendere Suchmechanismen"(44) vielleicht gar nicht in allen Bereichen nötig sind, sondern nur in jenen, die direkt mit dem öffentlichen Interesse zu tun haben, etwa die Darstellung politisch relevanter Information. Warum also nicht Forschung zu einer automatischen Nachrichten-Aggregation fördern, die – anstatt die Geschichten nach ihrer Beliebtheit zu reihen (das Prinzip von Google News) – versucht, die Komplexität und Heterogenität der Mediendebatte darzustellen? Die Anwendung des Prinzips der Vielfalt auf die Universalsuche hat seine Grenzen, und wie Pieter van der Linden, der Koordinator des Quaero-Projekts, in einem persönlichen Gespräch unterstrich, wird sich die Suche zunehmend auf Nischen konzentrieren müssen, um Fortschritte zu machen. Eine öffentliche Strategie der Forschungsförderung sollte Projekte nicht nur nach ihrem wirtschaftlichen Potenzial auswählen, sondern größere Fragen des öffentlichen Interesses in Betracht ziehen. Doch dies ist nicht der einzige Bereich, in dem der Staat eine produktive Rolle spielen kann.

Erkundung und Neureihung

Durch die Förderung der Autonomie der Nutzer lässt sich die Vielfalt steigern, selbst innerhalb der Universalanwendungen, die heute vorherrschen. Wenn Komfort bedeutet, die Interaktion zwischen den Nutzern und der Suchmaschine zu verkürzen, dann bedeutet Autonomie den Versuch zu verhindern, dass der Vermittler unsichtbar wird. Bildung kann sicher einen bewussteren und kompetenteren Umgang mit Suchmaschinen fördern, und die Aufnahme von kritischem Umgang mit Information in die Lehrpläne ist zu befürworten. Wir müssen allerdings auch an die technischen Mittel denken, mit denen sich die Vielfalt der Suchergebnisse erkunden lässt. Während query operators wie AND, OR, NOT sicher nützliche Tools sind, um auf eine größere Anzahl von Seiten zuzugreifen, sind diese derzeit recht begrenzt, und es gibt keine oder nur wenige Möglichkeiten, die Ranking-Parameter zu gewichten. Alternative Suchmaschinen wie Exalead (45) – eine der wenigen Universalsuchmaschinen, deren Ergebnisse deutlich von jenen des Marktführers abweichen – erlauben Suchen mit gewöhnlichen Ausdrücken, doch es gibt noch viel Raum für Verbesserungen bei der Kontrolle der Nutzer über den Suchprozess. Während der Einsatz von Suchparametern ein gewisses Fachwissen voraussetzt, gibt es auch Wege, den Suchprozess zu vertiefen, ohne ihn übermäßig komplex zu machen. Dazu zwei Beispiele:
  • Clusty (46) ist eine Suchmaschine, die die Ergebnisse in thematische Cluster teilt, welche es den Nutzer ermöglichen, bis zu 500 Resultate gleichzeitig zu navigieren. Die Liste der Cluster vermittelt einen ersten Überblick über den Gegenstand der Suche und kann den Nutzern neue Richtungen aufzeigen, die diesen vorher nicht bewusst waren.
  • TermCloud Search (47) ist ein Such-Interface, das einen Überblick über ein Thema gibt, anstatt den kürzesten Weg zwischen einer Suchanfrage und einem Dokument herzustellen. Es verwendet das einfache tagcloud-Prinzip, wo Stichwörter in verschiedenen Größen nach Relevanz dargestellt werden, wobei es darum geht, die Nutzer auf die Begriffe hinzuweisen, die ihre Suchanfrage umgeben, und sie zu einer Erkundung zu ermutigen, anstatt rasche Antworten bereitzustellen.
Diese beiden Beispiele sind recht einfach, doch es gibt ein enormes Potenzial im Design von Suchtechnologien und von Interfaces, die die Suche als Teil eines Wissensvermittlungsprozesses begreifen und Lernen, Vielfalt und Nutzer-Interaktion aktiv fördern. Den Vermittlungsprozess zu betonen, anstatt ihn zu verbergen, kann gleichzeitig auch die Autonomie der Nutzer stärken und ihren Zugang in die tieferen Bereiche des Index erleichtern. In den vergangenen Jahren sind explodierende Kosten zu einem Innovationshindernis geworden, da eine moderne Suchmaschine nicht nur ein komplexes Softwareprodukt ist, sondern auch anspruchsvolle Datenbank-Technologie beinhaltet. Die Index-Erstellung für ein ständig wachsendes Web und die tägliche Ausführung von Milliarden von Suchanfragen stellen eine schwierige Aufgabe dar, auch wenn viele Anfragen nur zu Navigationszwecken getätigt werden (wenn z.B. ebay im Suchfeld des Browsers eingegeben wird, um zu ebay.com zu kommen). Um schnelle Ergebnisse auf der ganzen Welt gewährleisten zu können, muss eine Firma ein Netz von Datacenters bauen, wobei jeder Knoten in physischer Nähe zu einem zentralen Internet-Knoten sein muss, um die Distanz der Datenübertragung zu minimieren. Eine Förderung der experimentellen Forschung und Entwicklung und der Innovation wird auf diese Infrastruktur-Fragen eingehen müssen.(48) Auf der Ebene der Organisation lässt sich dies auf mehrere verschiedene Arten bewerkstelligen, ich möchte aber kurz eine Route besprechen, die auf die Infrastruktur von etablierten Firmen zurückgreift.

Anwendungen wie Clusty und termCloud verwenden so genannte APIs (Application Programming Interfaces), um die Ergebnisse verschiedener Suchmaschinen in eine Maschinen-lesbare Form zu konvertieren (z.B. XML), Verarbeitungen durchzuführen (z.B. Neureihung der Resultate) und die Ergebnisse in einer auf die Suche abgestimmten Form darzustellen (z.B. Ergebnis-Cluster). Dies ist sicher ein großartiger Weg, um zu experimentieren und Ideen umzusetzen, ohne in eine Server-Infrastruktur investieren zu müssen. Es gibt dabei aber bedeutende Einschränkungen. Erstens ist die Zahl der Ergebnisse pro Anfrage recht niedrig – Google stellt nur bis zu acht her, Yahoo und Microsoft 50 – und während eine Anwendung mehrere Resultatsammlungen gleichzeitig laden kann, gibt es praktische Grenzen; Clusty geht bis 500 und die termcloud-Suche bis 250, um die Rechenzeiten in einem akzeptablen Rahmen zu halten. Zweitens begünstigen die Nutzungsbedingungen von APIs stark die Service-Provider. Im experimentellen Rahmen ist dies kein Problem, doch ein Unternehmen auf einem Such-API aufzubauen, kann eine riskante Angelegenheit sein, da die technischen Details und die rechtlichen Spezifikationen verändert werden können. Während es auf der Content-Seite robuste Lizenzmodelle gibt, z.B. Creative Commons, warten Entwickler, die API einsetzen, immer noch auf verlässliche Strukturen, um die rechtlichen Ungewissheiten auszuräumen.

Um die technischen Begrenzungen von Experimenten mit API zu lösen und "tiefe" Experimente zu ermöglichen, die nicht nur die Resultate anders reihen, sondern auch alternative Ranking-Methoden anwenden, sind "Sandkasten"-Lösungen vorstellbar.(49) Dies würde bedeuten, dass Suchanwendungen von externen Entwicklern in einer geschützten Umgebung ("Sandkasten") implementiert werden, während die Datacenters von Google Inc. und anderen Firmen verwendet werden, sodass die Programmierer direkt mit dem Index arbeiten können, ohne durch PageRank und andere Ranking-Techniken gehen zu müssen.

Es lassen sich mehrere Zwischenstufen zwischen dem derzeitigen API-basierten Zugang und einer vollständigen Sandkasten-Version vorstellen, die nach Schwierigkeit der Implementierung, wirtschaftlicher Machbarkeit, Innovationspotenzial und verbessertem Zugang zu Suchergebnissen variieren. Wie immer diese Zugänge im Einzelnen aussehen, ohne aktive Gesetzgebung hängt jede technische Lösung vom Wohlwollen der Service-Anbieter ab. Die französischen Gesetze zur kulturellen Vielfalt, die Fernsehstationen dazu verpflichten, einen bestimmten Prozentsatz ihrer Einnahmen in die Kinoproduktion zu investieren, könnten als ungefähres Modell dafür dienen, wie bindende Erfordernisse der Ressourcenteilung aussehen könnten. Das Projekt der Demokratisierung der Suche ist ohne ein Minimum an Engagement der öffentlichen Hand schwer vorstellbar.

Schluss

Das Ziel dieses Texts war, die normativen und die praktischen Aspekte des Unterfangens zu prüfen, das Potenzial des Web zu schützen – als "wertvollen Kollisionsraum zwischen offiziellen und inoffiziellen Darstellungen der Wirklichkeit" angesichts von Suchmechanismen, die auf Beliebtheit und Komfort setzen.(50) Das Problem ist Teil einer größeren Debatte darüber, wie Technologie kontrolliert werden kann, die algorithmisch verfährt und in sehr großem Maßstab Aufgaben übernimmt, die ein menschliches Urteil verlangt, etwa die Auswahl und die Analyse von Information. Wenn wir Mechanismen wie die Link-Analyse untersuchen, dann zeigt sich, dass diese technischen Verfahren die Welt nicht in gleicher Weise unterteilen, wie es unsere kulturelle Konditionierung tut, was zu einem beträchtlichen Maß an begrifflicher Unsicherheit führt und zwar bereits auf der Ebene der Analyse, und erst recht, wenn es um normative Betrachtungen geht. Wie wir gesehen haben, ist die Anwendung von demokratischen Prinzipien auf die Kontrolle von Informationstechnologie eine heikle Angelegenheit, die verlangt, dass man sich auf Grundfragen der politischen Organisation besinnt. Die Komplexität der sozio-technischen Konfigurationen im Bereich der Suche und anderer Gebiete der "kulturellen" Informationstechnologie wird in den kommenden Jahren noch weiter zunehmen, und die Aufgabe, klare Linien für technisch-normatives Denken zu definieren, wird sicher nicht einfacher. In diesem Beitrag habe ich darzustellen versucht, wie man von einer kritischen Analyse der Technologie zu expliziten Empfehlungen kommen kann, ohne auf eine Diskussion des politischen Bezugsrahmens, der für beide gilt, zu verzichten. Denn der Kern des Problems ist: Die "Demokratisierung der Suche" erfordert ein klares begriffliches Verständnis der Technologie, ebenso wie ein Überdenken unseres Verständnisses von Demokratie. Und sie erfordert die Herstellung von Verbindungen zwischen diesen beiden auf den Ebenen der Kritik, des Designs und der Politik.


Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen.

Mehr lesen

Dialog

Die Netzdebatte

Netzdebatte ist das Debattenportal der Bundeszentrale für politische Bildung. Das Weblog greift Themen auf, die die Gesellschaft bewegen. Netzdebatte erklärt Hintergründe, bildet Positionen ab und bietet einen Ort zum Diskutieren.

Mehr lesen

spielbar.de

spielbar.de informiert über Computerspiele und erstellt pädagogische Beurteilungen. Pädagogen, Eltern und Gamer sind eingeladen, ihre eigenen Beurteilungen, Meinungen und Kommentare zu veröffentlichen.

Mehr lesen auf spielbar.de