O stronie www.historiawyszukiwarek.pl

Strona przedstawia historię najważniejszych wyszukiwarek internetowych począwszy od pierwszych idei systemów wyszukiwawczych z początku XX wieku, poprzez wyszukiwarki ery przed World Wide Web, a skończywszy na takich współczesnych liderach światowego rynku wyszukiwarek internetowych jak Google, Yahoo! oraz Bing. Opisana jest również krótka historia polskich serwisów przeszukujących Internet.

Przed powstaniem Internetu

Pierwsze idee

Jeszcze przed powstaniem pierwszych komputerów zdawano sobie sprawę z potrzeby stworzenia systemu, który umożliwiałby gromadzenie, organizowanie i udostępnianie dostępnej wiedzy w możliwie prosty i szybki sposób, każdemu kto tego potrzebuje. Na początku XX wieku belgijski naukowiec Paul Otlet przedstawił ideę prohipertekstu, według której cała wiedza powinna być podzielona na możliwie najmniejsze fragmenty (np. pojęcia, artykuły, rozdziały książek). Byłyby one zapisane na oddzielnych, specjalnie opisanych kartach, powiązanych ze sobą za pomocą hiperłączy i przechowywanych w codziennie aktualizowanym katalogu. W 1937 roku podobną wizję, zautomatyzowanego systemu bazującego na mikrofilmach, w którym "wiedza i idee są pozyskiwane, porządkowane, podsumowywane, objaśniane i porównywane" [1], nakreślił angielski pisarz Herbert George Wells w eseju "The Brain Organization of the Modern World".

Projekt Memex

Wielu historyków przedstawiając pierwsze ślady źródeł sieci WWW oraz wyszukiwarek internetowych, wskazuje na rok 1945 i na amerykańskiego inżyniera, wynalazcę Vannevara Busha. Jest on uważany nie tylko za prekursora idei hipertekstu i sieci komputerowych, ale również za pomysłodawcę stworzenia maszyny do przechowywania i wyszukiwania powiązanych ze sobą informacji. W 1945 roku na łamach magazynu The Atlantic Monthly, w artykule "As We May Think" [2], ogłosił on koncepcję elektromechanicznego urządzenia o nazwie Memex. Składało się ono z dwóch ekranów, połączonych ze zbiorem mikrofilmów i miało możliwość wyświetlania oraz edycji dowolnego dokumentu z tego zbioru (rys. 1).

Projekt systemu Memex
Rys. 1. Projekt systemu Memex - "Memory extender"Źródło: https://atlas.colorado.edu/~hofmocke/digitalpoetry/memex.html

W zamyśle Vannevara Busha urządzenie pozwalałoby na wyszukiwanie informacji na drodze skojarzeń, działając w sposób najbardziej naturalny dla ludzkiego umysłu. Rewolucyjna jak na owe czasy idea, chociaż nigdy nie została zrealizowana w funkcjonującej postaci, to stała się bezpośrednią inspiracją dla takich naukowców, jak: Joseph Licklider, Douglas Engelbart czy Ted Nelson oraz przyczyniła się do powstania wielu współczesnych technologii i rozwiązań informatycznych.

Wyszukiwarki ery przed World Wide Web

Archie

Historia serwisów przeszukujących Internet zaczyna się jeszcze przed opublikowaniem przez Tima Bernersa-Lee pierwszej strony WWW. W 1990 roku Alan Emtage, student uniwersytetu McGill w Montrealu, stworzył narzędzie do przeszukiwania zasobów FTP - program o nazwie Archie. Aplikacja tworzyła bazę danych na podstawie wszystkich nazw plików umieszczonych na anonimowych hostach FTP. Wyszukiwanie początkowo odbywało się za pomocą uniksowych poleceń, jak np. grep, później wprowadzono dostęp poprzez telnet, pocztę elektroniczną i program klienta Archie, aż w końcu poprzez strony www. Powstało wiele hostów z usługą Archie, a polską wersję nadal można znaleźć pod adresem http://archie.icm.edu.pl co przedstawia rys. 2.

Strona archie.icm.edu.pl
Rys. 2. Strona archie.icm.edu.pl z wciąż działającą usługą Archie

Veronica i Jughead

Arche nie indeksował zawartości plików. Możliwość indeksowania dokumentów z prostym tekstem pojawiła się wraz z wprowadzeniem powstałego w 1991 roku na Uniwersytecie w Minnesocie protokołu warstwy aplikacji TCP/IP o nazwie Gopher. Jego popularność doprowadziła do stworzenia systemów wyszukiwawczych Veronica i alternatywnego Jughead, pozwalających na odnajdywanie na podstawie słów kluczowych, referencji w tworzonych przez Gophera indeksach. Protokół ten został jednak szybko wyparty przez dynamiczny rozwój sieci WWW.

Pierwsze współczesne wyszukiwarki internetowe

Wandex

Pierwszą wyszukiwarką internetową, która działała w sposób zbliżony do współczesnego, był opracowany przez Matthewa Graya z Massachusetts Institute of Technology w 1993 roku Wandex. Wykorzystywał on, stworzonego pierwotnie w celu zmierzenia wielkości sieci WWW, bota indeksującego o nazwie World Wide Web Wanderer. Ten, uważany za pierwszy na świecie robot sieciowy, wkrótce posłużył do indeksowania adresów URL stron internetowych i stał się bazą dla przyszłych wyszukiwarek.

Excite i JumpStation

Wandex nie analizował zawartości strony, częściowo taką możliwość miał Excite (pierwotnie znany jako projekt Architext) oraz JumpStation. Ten ostatni indeksował tytuły oraz nagłówki dokumentów i jako pierwszy zachowywał się w ten sam sposób co współczesne wyszukiwarki, wykorzystując do tego trzy podstawowe moduły: crawlera, indeksera i searchera.

WebCrawler

W 1994 roku Brian Pinkerton wprowadził WebCrawlera, który był pierwszą wyszukiwarką indeksującą pełną zawartość dokumentów i pozwalającą na wyszukiwanie dowolnych słów znajdujących się w treści stron. WebCrawler cieszył się ogromną popularnością wśród internautów. Wkrótce po nim powstało wiele znanych, w większości komercyjnych rozwiązań, jak: Lycos, Infoseek, AltaVista, Inktomi, HotBot czy Ask.

W latach 1994-1998 zostały stworzone też pierwotne wersje najpopularniejszych obecnie wyszukiwarek o zasięgu globalnym: Yahoo!, Google i Bing (wówczas MSN Search).

Obecni liderzy rynku wyszukiwarek internetowych

Yahoo!

Jako pierwszy, duży sukces odniósł, stworzony w 1994 roku, serwis Yahoo!, mimo że na początku był tylko zwykłym katalogiem stron internetowych, bez możliwości przeszukiwania ich pełnej zawartości.

Strona główna yahoo.com z listopada 1996 roku
Rys. 3. Strona główna yahoo.com z listopada 1996 rokuŹródło: Internet Archive - The Wayback Machine, http://web.archive.org

Yahoo! pod koniec lat dziewięćdziesiątych przekształcił się w portal, w którym funkcja wyszukiwania stała się jednym z dodatków i korzystała z zewnętrznych rozwiązań: Inktomi, Overture (właściciela AltaVisty), a do 2004 roku - Google. W kolejnych latach Yahoo! stosowało własny mechanizm zbudowany na bazie rozwiązań od zakupionych firm Inktomi Corporation i Overture Services.

W 2009 roku Yahoo!, podpisując 10-letnią umowę z Microsoftem, zrezygnowało z własnej wyszukiwarki stopniowo wprowadzając w jej miejsce wyniki serwowane przez Bing'a. Polska wersja portalu została uruchomiona dopiero w 2011 roku.

Google

Na szczególną uwagę zasługuje historia wyszukiwarki Google [3] (roboczo nazwanej BackRub), stworzonej w 1996 roku przez Amerykanina Larry'ego Page'a oraz Rosjanina Sergeya Brina w ramach studenckiego projektu [4] na Uniwersytecie Stanforda. Zastosowali oni nowatorski algorytm o nazwie PageRank do oceny jakości stron poprzez analizę powiązań hipertekstowych. Dzięki niemu wyniki zwracane przez wyszukiwarkę były bardziej trafne i adekwatne do zadanego pytania, niż w przypadku rozwiązań konkurencyjnych.

Oficjalnie jako firma Google Inc. powstała we wrześniu 1998 roku, niedługo potem uruchomiono stronę google.com. Podczas gdy wiele wyszukiwarek rozbudowało się o nowe funkcje nie związane z ich podstawowym przeznaczeniem, stając się tym samym portalami internetowymi, strona główna Google od początku zachowała swój minimalistyczny interfejs (co przedstawia rys. 4). Dokładność zwracanych wyników wyszukiwania, szybko została zauważona przez internautów, doprowadzając do gwałtownego wzrostu popularności Google oraz wyparcia z rynku wielu konkurencyjnych rozwiązań. Od 2000 roku, wraz z wprowadzonym serwisem AdWords, w wynikach wyszukiwania wyświetlane są reklamy kontekstowe w postaci linków sponsorowanych.

Strona główna google.stanford.edu z 11 listopada 1998 roku
Rys. 4. Strona główna google.stanford.edu z 11 listopada 1998 rokuŹródło: Internet Archive - The Wayback Machine, http://web.archive.org

Aktualnie Google oprócz wyszukiwarki rozwija wiele innych serwisów i aplikacji, do najpopularniejszych produktów należą: YouTube, Gmail, Blogger, Picasa, Android, oraz Google: Chrome, Maps, Analitycs, News, Earth, AdWords, AdSense. Google z projektu studenckiego, w przeciągu kilku lat stała się najszybciej rosnącą, aktualnie najbardziej wartościową marką na świecie [5], a jej twórcy znaleźli się w czołówce rankingu najbogatszych i najbardziej wpływowych ludzi świata [6].

Bing

W tym samym roku co oficjalnie Google, wyszukiwarkę o nazwie MSN Search, uruchomił Microsoft. Początkowo wyświetlała ona wyniki w oparciu o technologię Inktomi. W kolejnych latach, do czasu wdrożenia w pełni autorskiego silnika, korzystano z rozwiązań Looksmart i AltaVista. W 2006 roku "gigant z Redmont" zaprezentował nową odsłonę swojej wyszukiwarki - Windows Live Search, rebrandowaną rok później na Live Search.

Loga kolejnych odsłon wyszukiwarki Microsoftu.
Rys. 5. Loga kolejnych odsłon wyszukiwarki Microsoftu.

W sierpniu 2009 dotychczasowy serwis został zastąpiony przez wyszukiwarkę Bing. Aktualnie wszystkie jej funkcje dostępne są tylko w wersji zlokalizowanej dla Stanów Zjednoczonych oraz dla innych wybranych krajów. Polscy internauci otrzymują dostęp do uboższej, pozbawionej wielu funkcjonalności wersji serwisu. Bing wskazywany jest jako główny konkurent dla Google. Jednak do tej pory, za wyjątkiem USA gdzie obecnie kontroluje ok. 8,6% rynku (18% razem z Yahoo!) [7], jego popularność jest niewielka.

Polskie serwisy przeszukujące Internet

Aby od początku prześledzić historię serwisów wyszukiwawczych w Polsce należy wrócić do listopada 1995 roku. Wtedy na serwerach Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego zostaje uruchomiona polska wersja Archie, indeksująca krajowe zasoby FTP. W połowie 1996 roku serwis ten zostaje uzupełniony o możliwość przeszukiwania, stosunkowo niewielkiej liczby, rodzimych serwerów WWW. W tym samym roku startują pierwsze w pełni polskie wyszukiwarki stron: Netoskop uruchomiony na serwerach pisma komputerowego Chip oraz Sieciowid firmy Polska OnLine, który z powodów prawnych szybko kończy swoją działalność. Wkrótce potem dotychczasowe katalogi: Wirtualna Polska (wp.pl) a następnie Optimusnet (onet.pl), zostają uzupełnione o wyszukiwarki stron internetowych. Warto w tym miejscu wspomnieć, że na stronach wp.pl od 2002 roku jest wykorzystywana, opracowana przez firmę XOR Internet z Warszawy, wyszukiwarka Netsprint. Natomiast na konkurencyjnym onet.pl stosowano zmodyfikowane rozwiązania najpierw InfoSeek, następnie Altavista oraz Inktomi. W 2006 roku został użyty silnik Morfeo, a aktualnie jest to połączenie silnika Google z mechanizmem przeszukującym tylko strony Onetu.

Zakończenie

Rynek wyszukiwarek ciągle się zmienia, powstają nowe rozwiązania, a dotychczasowe są ulepszane. Historia informatyki uczy, że nawet największe firmy nie mogą być pewne swojej przyszłości. Często małe, "garażowe" projekty stają się przełomowymi i odnoszą wielkie sukcesy, aby następnie jeszcze szybciej o nich zapomniano.

Źródła, przypisy, polecane materiały

  1. Wells H. G., World Brain. Meuthuen & Co. Limited 1938, s. 49
  2. Bush V., As We May Think, The Atlantic Monthly, lipiec 1945,
    www.theatlantic.com/doc/194507/bush
  3. Historia firmy Google, Corporate information - Google milestones,
    www.google.com/intl/pl/about/corporate/company/history.html
  4. Lawrence Page i Sergey Brin, praca akademicka: The Anatomy of a Large-Scale Hypertextual Web Search Engine, Uniwersytet Stanforda 1996r., infolab.stanford.edu/~backrub/google.html
  5. W latach 2007-2010 firma Google znalazła się na pierwszym miejscu w zestawieniu BrandZ Top 100 prezentującym najbardziej wartościowe marki na świecie wg Millward Brown, www.millwardbrown.com/Sites/mbOptimor/Ideas/BrandZ_Rankings/BrandZTop100.aspx
  6. L. Page i S. Brin znaleźli się na 26 miejscu na liście najbogatszych ludzi świata i na 5 miejscu na liście najbardziej wpływowych ludzi świata w 2009 roku magazynu Forbes, World's Most Powerful People 2009, www.forbes.com/lists/
  7. StatCounter Global Stats, Top 5 Search Engines in the United States, listopad 2011, gs.statcounter.com

Polecane materiały