To, co należało kiedyś do fantastyki naukowej, jest teraz codziennością w świecie wyszukiwania informacji. Amit Singhal, inżynier z tytułem Google Fellow, przedstawia w tym artykule zadziwiające możliwości, jakie przyniosły nam wyszukiwarki, oraz perspektywy ich przyszłego rozwoju.

Będąc małym chłopcem w Indiach, marzyłem o lotach w kosmos. Oglądając serial Star Trek, dotarłem do ostatecznej granicy. Pamiętam, z jakim podziwem patrzyłem, gdy Spock i spółka teleportowali się na powierzchnie tajemniczych planet, używali skanerów do poznawania otoczenia i nawiązywali rozmowy z kosmitami.

Moja praca polega teraz na urzeczywistnianiu tych fantazji naukowych – i wychodzi mi to całkiem nieźle. Gdy 20 lat temu wyszukiwanie informacji po raz pierwszy zawładnęło moją wyobraźnią, internet był skąpo zapełniony tekstami, a dostęp do danych był irytująco powolny. Ale pomimo tych ograniczeń „surfowanie po sieci” i tak przypominało zgłębianie kosmosu – odkrywanie rozległych niezbadanych obszarów. Obecnie możemy udać się w podróż na powierzchnię Marsa lub w głębiny oceanu, nie ruszając się nawet z kanapy, rozpoznawać charakterystyczne obiekty na całym świecie przez sfotografowanie ich za pomocą telefonu komórkowego oraz rozmawiać z osobami z drugiego końca globu w dziesiątkach języków, których się nawet nie uczyliśmy. A wszystko to zawdzięczamy niewiarygodnym – przywodzącym na myśl fantastykę naukową – postępom w rozwoju internetu i technologii wyszukiwania.

Dokąd właściwie zmierza rozwój wyszukiwania? Przyjrzyjmy się najpierw, jak urzeczywistniły się nasze wczesne fantastyczno-naukowe marzenia o wyszukiwaniu informacji.

Wyszukiwanie_nie_tylko_tekstowe

Gdy w Google mówimy o porządkowaniu informacji z całego świata, nie mamy na myśli tylko tekstów – obrazy i filmy również zawierają mnóstwo informacji. W dawnych czasach tego rodzaju materiały w ogóle nie występowały online. Dzięki takim usługom jak chociażby Google Earth i Street View, możemy obecnie dostarczać w sieci coś niezwykle cennego: obrazy świata fizycznego.

„Obecnie możemy udać się w podróż na powierzchnię Marsa lub w głębiny oceanu, nie ruszając się nawet z kanapy”.

Jednak pod wieloma względami pozyskiwanie informacji wizualnych z sieci to ta łatwiejsza część zadania. Trudniejsze jest ich zrozumienie. W odróżnieniu od tekstu nie możemy po prostu przeczytać obrazu ani filmu. Musimy do nich zajrzeć, wydobyć z nich piksele i przekształcić je w coś użytecznego. Przez długi czas uważaliśmy to za mrzonkę, ale dzięki połączeniu metodologii wyszukiwania i przełomowych rozwiązań technicznych w dziedzinie komputerowej obróbki sygnału wizji, potrafimy już dopasowywać obrazy do wyszukiwanych haseł na poziomie wizualnym. Wpisz w Google hasło „Góra Rushmore”, a nasze algorytmy przeanalizują wiele czynników, np. kształt i fakturę decydujące o jakości wizerunku Góry Rushmore, a następnie wyświetlą Ci odpowiednie obrazy o uderzającej pełni barw. Jeszcze lepiej – zrób zdjęcie Góry Rushmore, a Gogle Google rozpoznają ją i wyświetlą trafne wyniki zapytania. Nie musisz nawet niczego wpisywać. (A jeśli nie chce Ci się jechać do Dakoty Południowej, możesz zawsze samodzielnie odtworzyć ten pomnik).

Wyszukiwanie_bez_barier_językowych

Eliminowanie barier językowych może otworzyć przed nami zupełnie nowe perspektywy. Niestety, inżynierowie pracujący nad technikami translatorskimi szybko doszli do wniosku, że nauczenie komputera tłumaczenia z języka naturalnego jest jeszcze trudniejsze niż nauczenie tego człowieka. Ludzie uczą się języka, łącząc słownictwo z regułami gramatycznymi. Ale jak wszyscy wiemy, języki naturalne są bardzo złożone. Występują w nich wyjątki od zasad, wyjątki od wyjątków i wyjątki od tych wyjątków. Te wyjątki, choć piękne dla ludzi, komputerom wydają się „nielogiczne” i powodują słabą jakość tłumaczeń maszynowych, które są z reguły bezużyteczne. Dodatkowo próba nauczenia komputerów wspomnianych wyjątków okazała się mało realna. Aby tłumaczyć między każdą możliwą parą języków, nieważne, czy będzie to z japońskiego na chiński, z hindi na koreański czy z urdu na suahili, komputer musiałby opanować olbrzymią liczbę wyjątków.

Zamiast więc zaprogramować mnóstwo reguł, dostarczyliśmy naszemu mechanizmowi translatorskiemu tysiące profesjonalnie przetłumaczonych dokumentów, a następnie użyliśmy modeli statystycznych do wykrywania w nich wzorców. Te wzorce pomogły nam w wykryciu niezliczonych korelacji, na których podstawie możemy zacząć przewidywać najlepszy sposób przetłumaczenia danego słowa, wyrażenia lub dokumentu. Obecnie Tłumacz Google może Ci pomóc w odczytywaniu wyników wyszukiwania, stron internetowych, e-maili, napisów do filmów w YouTube itd. w ponad 50 językach. A to dopiero początek. Dzięki trafiającej do urządzeń mobilnych technice rozpoznawania mowy możesz nawet porozmawiać z kimś w czasie rzeczywistym twarzą w twarz w wielu językach, korzystając z funkcji tłumaczenia wypowiadanych słów.

Wyszukiwarka_która_mnie_zna

Jednym z obrazów najsilniej kojarzonych z fantastyką naukową jest robot-służący, który przynosi Ci kapcie, wie, jak ciepłą lubisz herbatę, i przewiduje Twoje potrzeby. Na pewno nie udało nam się jeszcze tego zrealizować, ale dostarczanie bardziej spersonalizowanych treści jest pierwszym krokiem w odpowiednim kierunku.

Obecnie każdy ma własną wersję wyszukiwarki Google. Twoja różni się od mojej, która jest z kolei inna niż wersja mojego sąsiada itd. Ma to duży sens, ponieważ wszyscy mamy unikalne, odmienne zainteresowania.

Ale tworzenie wyszukiwarki dopasowanej do milionów użytkowników nie jest prostym zadaniem i wiele czynników wpływa na to, jakie wyniki będą dla Ciebie w danej chwili najtrafniejsze. Google ma np. zlokalizowane wersje na ponad 150 obszarach geograficznych, więc jeśli wyszukasz hasło „pizza” w Krakowie, zobaczysz restauracje ze swojej okolicy. Brzmi prosto, prawda? Ale sprawy gwałtownie się komplikują przy zastosowaniu bardziej wyrafinowanych modeli użytkowników.

Weźmy np. wyszukiwane hasło „lordowie”. To proste słowo może każdemu kojarzyć się z czymś zupełnie innym – izbą wyższą brytyjskiego parlamentu, zamkami i mieczami, a nawet z wieloosobowymi grami online. Jednak będąc fanem indyjskiego krykieta, ciągle wyszukuję i klikam linki związane właśnie z tym sportem. Kiedy więc wpiszę w Google hasło „lordowie” w języku angielskim (czyli „lords”), otrzymuję wyniki związane z Lord’s Cricket Ground, czyli najsłynniejszym londyńskim stadionem krykietowym.

Wyniki stały się trafniejsze i bardziej spersonalizowane również dzięki wyszukiwaniu społecznościowemu, które uwzględnia sygnały od osób, z jakimi mam powiązania online. W moich wynikach może się więc pojawić tweet mojego znajomego o niedawnym meczu.

Wyszukiwanie_w_czasie_rzeczywistym

Jeszcze do niedawna znakomita większość informacji przechowywanych w systemach elektronicznych była zgromadzona w bardzo wyspecjalizowanych bazach danych, do których dostęp w celach badawczych był mocno ograniczony, a na dodatek często płatny. Od chwili napisania jakiegoś artykułu upływały długie miesiące, zanim zawarte w nim informacje zostały zindeksowane w bazach danych, by mogli je wyszukiwać badacze. Możliwość dostępu do danych w ciągu kilku sekund od ich wytworzenia całkowicie nas zmieniła, ale dla pierwszych naukowców korzystających z wyszukiwarek, pomysł wyszukiwania w czasie rzeczywistym zdawał się niemożliwy do zrealizowania.

Google wprowadził funkcję wyszukiwania w czasie rzeczywistym (ang. Realtime Search) – jeden z najbardziej złożonych projektów, nad jakimi miałem okazję pracować – w grudniu 2009 r. Opracowaliśmy kilkanaście nowych technologii, by niemal natychmiastowo określać trafność zaktualizowanych treści: od wydobywania informacji ze skróconych adresów URL poprzez analizę znaczenia hasztagów, np. „#obama”, aż po oszacowanie tempa zmian liczby zapytań w celu wykrywania gorących tematów. Efekt: gdy firma AT&T powiadomiła 20 marca 2011 r., że jest zainteresowana przejęciem operatora telekomunikacyjnego T-Mobile, funkcja wyszukiwania w czasie rzeczywistym zaczęła wyświetlać w wynikach Google tweety o tym fakcie na kilka minut przed pojawieniem się tego tematu w głównych agencjach informacyjnych.

Dzięki wyszukiwaniu w czasie rzeczywistym użytkownicy szybciej otrzymują informacje i nie ma żadnej przesady w stwierdzeniu, że może ono uratować ludzkie życie. Weźmy za przykład usługę Flu Trends – korzystamy ze zbiorczych danych wyszukiwania, by szacować aktywność wirusa grypy, dzięki czemu dostarczamy te informacje dwa tygodnie wcześniej niż amerykańskie Centrum Kontroli Chorób (CDC). Może to mieć olbrzymie znaczenie.

Wyszukiwarka_która_mnie_rozumie

Zaczęliśmy już uczyć komputery, jak tłumaczyć języki naturalne, ale nauczenie ich rozumienia mowy pozostaje nadal jednym z największych wyzwań. Wyszukiwarka Google wie na przykład, że skrót „GM” oznacza w kontekście samochodów nazwę General Motors, a w kontekście żywności – anglojęzyczne określenie „genetically modified” (zmodyfikowana genetycznie). A co ze słowami, które mają wiele znaczeń? Skąd Google wie, że gdy szukasz sposobu na zmianę jasności ekranu swojego laptopa, chcesz ją akurat „wyregulować”? W przeciwieństwie do tego, gdy chcesz zmienić format dokumentu z PDF na DOC, Google może Ci pomóc dowiedzieć się, jak „przekonwertować” ten plik.

„Z historii możemy się nauczyć tylko tego, że wizje fantastyczno-naukowe zawsze mają szansę się urzeczywistnić”.

Może to wyglądać na prostą zamianę słów, ale pamiętaj: komputery nie myślą jak ludzie. Zaprogramowanie komputera w taki sposób, by wydobywał znaczenie ze słów i kontekstu, zaczęło stawać się wyobrażalne dopiero jakieś 20 lat temu. A co gdybyśmy w tamtych czasach stwierdzili, że chcemy to uzyskać we wszystkich językach świata? Uznano by nas za szaleńców.

Wyszukiwarka_przyszłości

Świętym Graalem w dziedzinie wyszukiwania jest zrozumienie, czego chcą użytkownicy – nie tylko dopasowywanie słów, ale faktyczna próba dopasowywania ich znaczenia. Wykonywanie tego zadania, zanim użytkownik wpisze hasło do wyszukania, byłoby jeszcze milej widziane.

Codziennie do internetu trafiają miliardy dokumentów. Oczekiwania użytkowników stale się zmieniają. Chcemy otrzymywać informacje w dowolnych formatach, w każdym języku, dopasowane do osobistych upodobań, a na dodatek chcemy je mieć JUŻ. Bez wątpienia przyszły rozwój wyszukiwarek będzie wymagać mnóstwa pracy, ale z drugiej strony przebyliśmy już całkiem długą drogę w dość krótkim czasie.

W samym ubiegłym roku wprowadziliśmy w naszej wyszukiwarce ponad 500 ulepszeń. Ale kiedy dąży się do doskonałości, nieważne, jak daleko się zaszło i jak wiele pozornie nierozwiązywalnych problemów udało się pokonać, zawsze pozostaje coś do zrobienia. Dla mnie świętym Graalem w dziedzinie wyszukiwania jest zrozumienie, czego chcą użytkownicy – nie tylko dopasowywanie słów, ale faktyczna próba dopasowywania ich znaczenia. Wykonywanie tego zadania, zanim użytkownik wpisze hasło do wyszukania, byłoby jeszcze milej widziane.

Wyszukiwanie dynamiczne Google daje nam tego przedsmak. Bierze ono pod uwagę to, co użytkownik zdążył już wprowadzić, przewiduje najbardziej prawdopodobny ciąg dalszy i w ten sposób podaje wyniki w trakcie pisania – umożliwiając sprytniejsze, szybsze wyszukiwanie, które ma interaktywny charakter, wyprzedza zamiary użytkownika i jest bardzo skuteczne. Zapytaj tylko Claya Shirky’ego, co możemy robić z oszczędzanym dzięki temu czasem.

Moja wymarzona wyszukiwarka przyszłości powinna prowadzić mnie za rękę przez cały dzień. Znać termin mojego najbliższego spotkania w centrum miasta, a jeśli ulice dojazdowe są zamknięte, polecić mi skorzystanie z metra. Przypominać mi o urodzinach żony z dwutygodniowym wyprzedzeniem, podpowiedzieć mi, że chciałaby dostać w prezencie iPada, oraz zasugerować rozmowę z moim znajomym, Mattem, który właśnie zakończył kolejny etap rozwoju swojego rozwiązania do Wi-Fi. Następnie powinna mi podać wskazówki dojazdu do najbliższego sklepu. Mogłaby nawet wskazać pobliską romantyczną restaurację, przejrzeć harmonogramy zajęć moje i mojej żony oraz zarezerwować nam stolik na kolację przy świecach.

Z historii możemy się nauczyć tylko tego, że wizje fantastyczno-naukowe zawsze mają szansę się urzeczywistnić. Wprawdzie nie wiemy jeszcze, jak teleportować Cię na obcą planetę, ale w końcu mamy dopiero rok 2011.