Ein Besucher blickt auf das Rechenzentrum des CERN.
1 | 2 | 3 | 4 | 5 | 6 Pfeil rechts

Die Suche vor grep

Eine Entwicklung von Geschlossenheit zu Offenheit?


8.4.2011
Paul Duguid identifiziert zwei Trends, die mit der Praxis des Suchens verbunden sind: Zum einen die Notwendigkeit, immer mehr Informationen zu verwalten. Zum anderen eine Spannung zwischen Praktiken, die den Zugang zu Information erleichtern, und jenen, die die Möglichkeiten einschränken.

Eine Frau arbeitet an einem Computer, aufgenommen im Finanzamt Oklahoma City 1969, während im Hintergrung ein Mitarbeiter ganz klassisch die Aktenablage durchsucht.Immer mehr Informationen gilt es zu verwalten. - Arbeit am Computer im Finanzamt von Oklahoma City im Jahr 1969. (© AP)
In den vergangenen Jahren wurde das Internet zunehmend durch Praktiken des Suchens definiert: seine Ressourcen werden meist durch ein Suchfeld erreicht.(1) Das Internet ist neu, aber das Durchsuchen von Informationsammlungen natürlich nicht. Und obwohl es so aussieht, als hätten die modernen Suchmethoden viel des alten Apparats hinter sich gelassen, und als sei Information "frei" und autonom, kann ein historisches Verständnis der Entwicklung dieses Apparats zur Klärung dessen beitragen, was tatsächlich neu ist, und vielleicht auch Aufschluss darüber geben, was in der entstehenden Welt der digitalen Suche möglich ist und was nicht. Dieser Essay versucht in einer sehr spekulativen, unvollständigen und fragmentarischen Form eine Vorstellung davon zu entwickeln, wie eine solche Geschichte aussehen könnte.

Die Welt von grep



Die Trennung zwischen der kurzen Periode der digitalen Suche und ihrer langen, analogen Vergangenheit kann durch zwei Gs veranschaulicht werden, die für grep und Google stehen. Grep ist ein äußerst mächtiges Suchwerkzeug, das 1973 für UNIX entwickelt wurde.(2) Es ermöglicht den Suchenden, digitale Dokumente nach "regulären Ausdrücken" zu durchsuchen, nach jedem darstellbaren Teil oder string (der Buchstaben, wild cards, Leerräume, Satzzeichen oder Zeilenenden beinhalten kann) in der elektronischen Version eines Texts zu suchen. Sein nächstliegender Vorgänger war wahrscheinlich die umständliche Konkordanz, diese funktionierte jedoch nur mit ganzen Wörtern und fällt weit hinter grep zurück. Googles Intervention lässt sich jedoch sogar anhand des Abstands zu seinen digitalen Vorgängern Veroncia, Archie, Alta Vista und Yahoo! messen. Deren Suchverfahren beruhten in unterschiedlichem Maße auf hierarchischen Ordnungen. Google hat diesen Zugang implizit aufgegeben und ermöglicht es uns, strings ohne Rücksicht auf die hierarchischen Ordnungen in der herkömmlichen Organisation von Dokumenten ausfindig zu machen und die Ergebnisse nach der Intertextualität des Internet zu reihen.(3) Grep und Google haben das Suchen in eine Welt der Information überführt, in der Semantik, Syntax und Hierarchie keine Rolle spielten. Das Suchen wurde damit zu einem Mechanismus und ein Beispiel für die Abkehr von altbekannten materiellen, begrifflichen und institutionellen Beschränkungen, und die Hinwendung zu "offenen" Informationslandschaften, für die sich die Vertreter von Open Source und Web 2.0 einsetzen.(4)

Die Vision einer offenen, modularen und nicht-hierarchischen Informationslandschaft ist nicht ganz neu. Paul Otlet, der Großvater der "Informationswissenschaft", vertrat schon vor langem die Auffassung, dass ein Buch weniger eine Informationsquelle als eine Einschränkung von Information ist:
    Die äußere Beschaffenheit eines Buchs, sein Format und die Persönlichkeit seines Autors sind nicht von Belang, solange sein Inhalt, seine Informationsquellen und seine Schlussfolgerungen erhalten bleiben und zum Bestandteil der Wissensorganisation werden können, einer unpersönlichen Arbeit, die von allen durchgeführt wird [...] Ideal wäre es, [...] jeden Artikel und jedes Buchkapitel von sprachlichen Feinheiten, Wiederholungen und Ausschmückungen zu befreien, und das, was neu ist und eine Vermehrung des Wissens darstellt, separat auf Karten zu sammeln.(5)
Bill Mitchell, der Dekan des MIT-Media Lab, brachte eine ähnliche Sichtweise des Buchs als Einschränkung des freien Ideenflusses zum Ausdruck, als er es als nichts anderes als "Holzspäne in einer toten Kuh" bezeichnete – eine veraltete Technologie, deren Zeit abgelaufen sei, und die durch etwas Neues ersetzt werden müsse. Auch anderswo sprach man sich für "virtuelle" Bibliotheken oder "Bibliotheken ohne Wände" aus, betrachtete das Internet als Bibliothek, oder drückte den Wunsch aus, die informationsfeindlichen Lasten der Vergangenheit abzuschütteln und Wissen oder Information im Sinne Otlets zu sammeln. Steward Brand fasste diese Ideen in einem prägenden Satz zusammen: "Information will frei sein".

Auch wenn diese Vorstellungen merkwürdig anmuten – Mitchell scheint sich nicht darüber im Klaren darüber zu sein, dass ledergebundene Bücher nicht mit holzhaltigem Papier gemacht werden, und Brand darüber, ob Information etwas wollen kann oder überhaupt imstande ist, frei zu sein – die Geschichte, zumindest die von den Siegern erzählte Geschichte, scheint ihnen Recht zu geben. Die Tools, die von den zwei "Gs" eingesetzt wurden, haben triumphiert und ermöglichen es uns, völlig neue Formen des Suchens durchzuführen. String-Suchen im Stile von grep haben es uns ermöglicht, unseren Interessen zu folgen, anstatt sie Konkordanzen und Hierarchien unterzuordnen, die anderswo hergestellt wurden. Informations-Entkernungsdienste wie Google Books haben materielle und institutionelle Beschränkungen überwunden, um vollkommen neue Zugangsformen zu ungeheuren Datenmengen zur Verfügung zu stellen, weshalb Google trotz eines nicht-hierarchischen Ansatzes davon spricht, "die auf der Welt vorhandene Information zu organisieren". Ohne den bemerkenswerten Erfolg dieser Technologien in Abrede zu stellen, lohnt es sich doch, die Frage zu stellen, ob dieser Fortschritt Teil einer kontinuierlichen Entwicklung in der Geschichte der Suchmethoden ist, die sich von geschlossen zu offen und von beschränkt zu frei, kurz gesagt, von einer dunklen Vergangenheit in eine aufgeklärte Zukunft bewegt.

Eine Geschichte der Welt vor grep und Google kann diese Fragen erhellen. Und je mehr wir behaupten, die gegenwärtigen Möglichkeiten seien etwas noch nie Dagewesenes, desto mehr stehen wir in der Pflicht, uns mit der Vergangenheit auseinanderzusetzen. Oder wie können wir sonst wissen, was noch nie bzw. was schon einmal da gewesen ist?(6) Ein Blick auf die Geschichte des Suchens zeigt, dass es eine gehörige Portion Voreingenommenheit erfordert, um von einer linearen Emanzipation der Information zu sprechen, in deren Verlauf die materiellen und institutionellen Fesseln durch technische Innovationen gesprengt und nur durch revanchistische Angriffe auf den Fortschritt gebremst wurden.

Solche technische Darstellungen neigen zu darwinistischen und spenserschen Annahmen zum menschlichen Verhalten. Kilgour, ein ernsthafterer Wissenschaftler als viele jener, die sich einer teleologischen Sprache bedienen, bietet eine Variante dieser Geschichte in seinem Werk Evolution of the Book. Er erklärt die Auslese und das Aussterben in seiner evolutionären Geschichte mit einem angeborenen menschlichen Drang zur Informationssammlung. So behauptet er zum Beispiel, dass "das Bedürfnis, Information schneller zu finden, als es mit einem Buch in der Form einer Papyrusrolle möglich ist, zur Entwicklung des griechisch-römischen Index im zweiten Jahrhundert geführt hat".(7) Ich will zeigen, dass eine solche Darstellung der menschlichen Bedürfnisse zwar ihren Reiz hat, aber sowohl die Komplexität der Vergangenheit als auch die Herausforderungen der Zukunft unterschätzt. Das menschliche Informationsbedürfnis wird hier als a-historische, kulturunabhängige Konstante begriffen, die zu allen Zeiten und für alle Menschen gilt, welche ihrerseits ständig auf der Suche nach neuen Sammeltechnologien sind. Eine solche informationsorientierte Darstellung hat ihren Nutzen, kann aber auch irreführend sein, weil sie zeigt, wie wir die Tätigkeiten unserer entfernten Vorfahren sehen, aber übergeht, wie sie diese selbst gesehen haben. Das Übergehen der Differenz zwischen diesen beiden Sichtweisen ermöglicht es uns, die Vergangenheit für die Unterstützung gegenwärtiger Interessen in die Pflicht zu nehmen, auch wenn die Vergangenheit bei näherer Betrachtung eine solche Unterstützung nicht bieten kann. Die tatsächlichen Muster des menschlichen Verhaltens sind, wie ich zu zeigen hoffe, komplexer als deren Darstellungen in evolutionären oder emanzipatorischen Erzählungen. Zum Teil deswegen, weil die Informationsbeschränkungen, die wir so oft überwinden wollen, gleichzeitig Informationsquellen sein können, die uns zwar nicht notwendigerweise helfen, Information zu finden, aber uns oft ermöglichen, das Gefundene in kulturell spezifischer Weise zu beurteilen. Da die Beurteilung eine wesentliche Voraussetzung dafür ist, dass der Erfolg der Suche nicht dem Zufall überlassen bleibt, müssen solche Beschränkungs-Ressourcen oft in einer anderen Form geschaffen werden, welche nicht so recht zur konventionellen, progressiven Erzählung passen.



 

Publikation zum Thema

Deep Search

Deep Search

Beherrschen Suchmaschinen nicht nur Märkte, sondern auch unser Denken? Am Beispiel von Google untersucht das Buch deren Bedeutung und innere Systematik. Es diskutiert angemessene Reaktionen in Gesellschaft, Gesetzgebung und Politik sowie von Verbraucherseite. Weiter...

Zum Shop

Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere Teile der öffentlichen Verwaltung produzieren? Das Dossier klärt über die Möglichkeiten offener Daten für eine nachhaltige demokratische Entwicklung auf und zeigt, wie Datenjournalisten mit diesen Datensätzen umgehen. Weiter...