Was vor Kurzem noch Science Fiction war, ist in der Onlinesuche heute mittlerweile Realität. Google Fellow Amit Singhal sinniert in diesem Artikel über die ungeahnten Möglichkeiten, die die Onlinesuche uns bietet, und darüber, was die Zukunft uns noch bringen wird.

Als kleiner Junge in Indien habe ich immer vom Weltraum geträumt. Ich habe mir Star Trek im Fernsehen angeschaut und bin damit bis zu den Grenzen des Weltalls gereist. Staunend habe ich mit angesehen, wie Spock und seine Männer sich auf einen mythischen Planeten gebeamt, ihre Umgebung mit Scannern abgetastet und sich mit den Aliens unterhalten haben.

Heute trage ich selbst dazu bei, diese Science Fiction Wirklichkeit werden zu lassen. Und wir sind schon ziemlich nah dran ... Als ich vor zwanzig Jahren damit begann, mich für die Suche im Internet zu interessieren, gab es nicht sehr viel Text im Internet und die Datenübertragung war extrem langsam. Doch trotz dieser Einschränkungen war das „Surfen im Netz“ in etwa so, als würde man das Weltall erkunden: Man drang in ein großes, unbekanntes Gebiet vor. Heute können wir zum Mars fliegen und in die tiefsten Tiefen der Ozeane tauchen, ohne überhaupt vom Sofa aufstehen zu müssen. Wir erfahren mehr über Sehenswürdigkeiten auf der ganzen Welt, indem wir einfach mit dem Handy ein Foto machen, und wir kommunizieren mit Menschen, die sich auf der anderen Seite des Globus befinden, in Dutzenden von Sprachen, die wir nie gelernt haben. Das alles verdanken wir den unglaublichen Fortschritten im Bereich der Web- und Suchtechnologien. Ja, da kann man schon von Science Fiction sprechen.

Aber wie sieht nun die Onlinesuche der Zukunft aus? Um dies zu beantworten, sehen wir uns am besten einmal an, wie unsere ersten Träume von der Science-Fiction-Suche Wirklichkeit wurden.

Suche_geht_über_den_Text_hinaus

Wenn wir bei Google davon sprechen, dass wir die Informationen der Welt organisieren möchten, meinen wir damit nicht nur den Text. Bilder und Videos enthalten ebenfalls eine Fülle von Informationen. In den Anfängen des Internets gab es solche Inhalte überhaupt nicht. Heute können wir unseren Nutzern dank Google Earth und Street View etwas extrem Wertvolles bieten: Bilder unserer physikalischen Welt.

„Heute können wir zum Mars fliegen und in die tiefsten Tiefen der Ozeane tauchen, ohne überhaupt vom Sofa aufstehen zu müssen.“

Visuelle Informationen sind im Internet leicht zu bekommen. Diese Informationen jedoch richtig zu verstehen, ist weitaus schwieriger. Im Gegensatz zum Text können wir Bilder oder Videos nicht einfach „lesen“. Wir müssen die einzelnen Pixel analysieren und ihnen eine Bedeutung zuordnen. Sehr lange war das für uns ein unerfüllbarer Wunschtraum. Aber durch die Kombination von Suchmethoden und neusten technischen Errungenschaften in der Bilderkennung können wir heute Bilder auf visueller Ebene zuordnen. Wenn Sie zum Beispiel auf Google nach „Mount Rushmore“ suchen, analysieren unsere Algorithmen diverse Faktoren, die für ein gutes Bild des Mount Rushmore verantwortlich sind, wie zum Beispiel Form oder Struktur, und zeigen Ihnen dann diese Bilder in exzellenter Farbqualität. Noch besser: Wenn Sie den Mount Rushmore fotografieren, erkennt die Google-Brille das Bild und zeigt Ihnen relevante Suchergebnisse an. Sie müssen nicht einmal einen einzigen Buchstaben eintippen. (Und wenn Sie keine Lust haben, nach South Dakota zu reisen, können Sie das Monument einfach nachbauen, falls Ihnen das lieber ist.)

Suche_geht_über_Sprache_hinaus

Wer Sprachbarrieren überwindet, kann sich damit völlig neue Welten erschließen. Leider haben unsere Entwickler, die sich mit Übersetzungstechnologien beschäftigen, sehr bald festgestellt, dass es noch schwieriger ist, einem Computer das Übersetzen beizubringen, als einer lebendigen Person. Menschen lernen Sprachen, indem sie Vokabeln mit grammatischen Regeln verknüpfen. Aber wie wir alle wissen, sind Sprachen kompliziert. Jede Regel hat ihre Ausnahmen, jede Ausnahme ihre Ausnahmen, und diese Ausnahmen haben wiederum Ausnahmen. Diese Ausnahmen, die für Menschen schön sein mögen, sind für den Computer „unlogisch“ und führen zu einer schlechten Übersetzung, so dass Computerübersetzungen unbrauchbar werden. Außerdem ist es nicht so einfach, dem Computer diese Ausnahmen beizubringen. Um zwischen jeder möglichen Sprachpaarung zu übersetzen, sei es vom Japanischen ins Chinesische, oder aus dem Hindi ins Koreanische, oder aus dem Urdu in Suaheli, müsste der Computer sehr viele Ausnahmen lernen.

Deswegen haben wir beschlossen, keine Regeln zu programmieren, sondern unsere Übersetzungsmaschine mit Tausenden von professionell übersetzten Dokumenten zu füttern. Anhand statistischer Modelle haben wir dann versucht, Muster zu erkennen. Innerhalb dieser Muster haben wir unzählige Korrelationen identifiziert und ausgehend von diesen Korrelationen können wir nun allmählich die beste Übersetzung für ein bestimmtes Wort, einen Satz oder ein Dokument vorhersagen. Heute hilft Ihnen Google Translate, Suchergebnisse, Webseiten, E-Mails, die Unterzeilen der YouTube-Videos und vieles mehr in über 50 Sprachen zu verstehen. Und das ist erst der Anfang: Dank der immer besser werdenden Sprachtechnologie auf Mobilgeräten können Sie sogar mit jemandem eine mehrsprachige Unterhaltung in Echtzeit führen, wobei das, was Sie sagen, direkt übersetzt wird.

Suche_die_mich_kennt

Eines der klassischsten Bilder in Science Fiction ist der Hausroboter, der Ihnen Ihre Pantoffeln bringt, weiß, welche Temperatur Ihr Tee haben muss, und Ihnen alle Wünsche von den Augen abliest. So weit sind wir natürlich noch nicht, aber die Bereitstellung personalisierter Inhalte ist sicher der erste Schritt dorthin.

Heute besitzt jeder Nutzer seine eigene Google-Version. Ihr Google ist anders als mein Google, mein Google ist anders als das Google meines Nachbarn und so weiter. Das ist sinnvoll, da wir alle unsere ganz individuellen Interessen haben.

Aber es ist keine leichte Aufgabe, für Millionen von Nutzern eine individuell zugeschnittene Suchmaschine zu entwickeln. Viele Faktoren beeinflussen, welche Ergebnisse für Sie zu einem bestimmten Zeitpunkt die relevantesten sind. Ein Beispiel: Google ist über mehr als 150 geografische Domains lokalisiert. Das heißt, wenn Sie in Tokio den Suchbegriff „Pizza“ eingeben, werden Ihnen Pizzerien in ihrer Gegend angezeigt. Hört sich einfach an, nicht wahr? Aber je spezifischer die Nutzermodelle sind, desto schwieriger wird die Angelegenheit – und zwar exponentiell schwieriger.

Sehen wir uns zum Beispiel das englische Wort „Lords“ an. Ein einfaches Wort, das allerdings jeder mit unterschiedlichen Dingen in Verbindung bringt: mit dem britischen Parlament, mit Schlössern und Schwertern oder aber mit einem Multiplayer-Online-Spiel. Ich z.B. bin Fan von indischem Cricket, weshalb ich ständig nach Dingen, die mit Cricket zu tun haben, suche oder auf Links zum Thema Cricket klicke. Wenn ich also auf Google den Suchbegriff „Lords“ eingebe, werden mir Suchergebnisse zum Lord’s Cricket Ground angezeigt, dem berühmtesten Cricket-Feld Londons.

Dank der sozialen Suche, die Menschen miteinbezieht, mit denen ich im Internet in Kontakt stehe, sind die Suchergebnisse noch persönlicher und relevanter geworden. Das heißt, es könnte durchaus sein, dass mir in diesem Fall ein Tweet eines Freundes angezeigt wird, der über ein kürzlich stattgefundenes Spiel getwittert hat.

Suche_nach_dem_gegenwärtigen_Moment

Noch bis vor Kurzem waren die allermeisten elektronischen Daten in hoch spezialisierten Datenbanken abgelegt, auf die man nur in begrenztem Umfang zu Recherchezwecken zugreifen durfte, meist gegen Gebühr. Nach der Veröffentlichung eines Artikels dauerte es Monate, bis er in den fachbezogenen Datenbanken indiziert wurde und Wissenschaftler endlich danach suchen konnten. Heute können wir bereits wenige Sekunden nach ihrer Erstellung auf Daten zugreifen – das hat unser Leben verändert. Aber in den Anfängen der Suchtechnologie schien die Suche in Echtzeit für die Forscher so gut wie unerreichbar.

Google startete Realtime Search – eines der kompliziertesten Projekte, an denen ich bislang gearbeitet habe – im Dezember 2009. Wir haben ein Dutzend neue Technologien entwickelt, um die Relevanz neuer Informationen nahezu in Echtzeit bestimmen zu können: Die Technologien können u.a. Informationen aus verkürzten URLs entnehmen, Abkürzungen wie „#obama“ eine Bedeutung zuordnen oder heiß diskutierte Themen anhand Veränderungen des Suchvolumens erkennen. Das Ergebnis: Als AT&T am 20. März 2011 sein Interesse am Kauf von T-Mobile ankündigte, zeigte Google Realtime Search bereits mehrere Minuten lang Tweets zu dieser Neuigkeit an, bevor die großen Nachrichtenagenturen erst anfingen, darüber zu berichten.

Eine Suche mit Echtzeit-Ergebnissen liefert Nutzern Informationen viel schneller und ich denke man kann durchaus sagen, dass dies unter Umständen Leben retten kann. Nur ein Beispiel: Wir nutzen aggregierte Suchdaten, um Prognosen zur Grippeaktivität abzugeben. Und tatsächlich liefern wir diese Informationen um zwei Wochen schneller als die US-amerikanischen Zentren für Krankheitskontrolle und Prävention. Die Tragweite ist enorm.

Suche_die_mich_versteht

Wir haben damit angefangen, Computern beizubringen, wie man Sprachen übersetzt. Aber einem Computer beizubringen, die Sprachen auch tatsächlich zu verstehen, bleibt weiterhin eine unserer größten Herausforderungen. Google weiß, dass „GM“ im Kontext von Autos für die Abkürzung von „General Motors“, im Zusammenhang mit Ernährung aber für „genmanipuliert“ steht. Aber wie sieht es aus, wenn Wörter mehrere Bedeutungen haben? Nehmen wir zum Beispiel „ändern“: Wenn Sie die Helligkeit des Bildschirms ändern möchten, möchten Sie sie „anders einstellen“, aber wenn Sie eine PDF-Datei in ein Word-Dokument ändern möchten, möchten Sie sie „konvertieren“. Wie kann Google das erkennen?

„Wenn wir eins aus der Geschichte lernen können, dann, dass Science Fiction nicht Science Fiction bleiben muss.“

Diese verschiedenen Bedeutungen des Verbs „ändern“ mögen uns selbstverständlich vorkommen, aber: Computer denken nicht wie Menschen. Noch vor 20 Jahren war es unvorstellbar, einen Computer so zu programmieren, dass er Wörtern eine Bedeutung zuordnen kann. Stellen Sie sich vor, wir hätten damals gesagt, dass wir genau das für alle Sprachen der Welt versuchen möchten. Man hätte uns für verrückt erklärt.

Der heilige Gral der Onlinesuche ist zu verstehen, was die Nutzer wollen, nicht nur die Wörter zu erkennen, sondern wirklich die Bedeutung einer Suchanfrage zu verstehen. Noch besser wäre es, wenn dies erfolgt, bevor der Nutzer überhaupt eine Suchanfrage eingibt.

Die_Zukunft_der_Suche

Tag für Tag werden Milliarden neuer Dokumente ins Internet gestellt. Die Erwartungen der Menschen ändern sich ständig. Wir wollen Informationen in allen Formaten und in jeder Sprache erhalten. Außerdem sollten sie auf unsere Bedürfnisse zugeschnitten und SOFORT verfügbar sein. Es ist sicher noch ein langer Weg bis zur Zukunftstauglichkeit der Onlinesuche – aber die Wahrheit ist, dass wir in kurzer Zeit bereits sehr viel erreicht.

Allein im letzten Jahr haben wir 500 Verbesserungen an unserer Onlinesuche vorgenommen. Aber wer nach Perfektion strebt, sieht natürlich immer noch mehr Dinge, die zu tun und zu ändern wären, ganz gleich, wie weit er bereits gekommen ist und wie viele scheinbar unlösbare Probleme er bereits gelöst hat. Für mich ist das Entscheidende bei der Onlinesuche, dass wir verstehen müssen, was die Nutzer wollen. Die angezeigten Treffer dürfen sich nicht allein auf einzelne Wörter beziehen, sondern müssen auch die Bedeutung der Wörter berücksichtigen. Am besten wäre es natürlich, wenn die Ergebnisse schon vorhanden wären, bevor der Nutzer überhaupt eine Suchanfrage eingibt.

Google Instant ist ein erster Schritt in diese Richtung. Instant sieht sich die Buchstaben an, die Sie bereits eingegeben haben, trifft eine Voraussage darüber, wie das Wort wahrscheinlich weitergeht, und zeigt Ihnen, während Sie weitere Buchstaben eingeben, die zugehörigen Suchergebnisse an. Das führt zu einer intelligenteren, schnelleren Suche, die interaktiv, vorausdeutend und leistungstark ist. Fragen Sie doch Clay Shirky, was wir mit der gewonnenen Zeit alles anfangen können.

Meine Traumsuchmaschine der Zukunft begleitet mich den ganzen Tag. Sie weiß, wo mein nächstes Treffen stattfindet und dass ich wegen des Staus besser die U-Bahn nehmen sollte. Sie erinnert mich daran, dass meine Frau in zwei Wochen Geburtstag hat, sagt mir, dass sie sich ein iPad wünscht, und schlägt mir vor, mit meinem Freund Matt darüber zu sprechen, weil er kürzlich dessen WLAN-Fähigkeiten unter die Lupe genommen hat. Dann schickt sie mir eine Wegbeschreibung zum nächsten Geschäft. Sie könnte mir sogar ein romantisches Restaurant in der Nähe aussuchen, unsere Kalender überprüfen und einen Tisch für zwei Personen reservieren.

Wenn wir eins aus der Geschichte lernen können, dann, dass Science Fiction nicht Science Fiction bleiben muss. Leider haben wir noch nicht herausgefunden, wie wir Sie ins All beamen können, aber gut, es ist auch erst das Jahr 2011.