Bilion adresów stron zindeksowanych przez Google

Strona głównaBilion adresów stron zindeksowanych przez Google
26.07.2008 14:29
Adam Wróblewski
Adam Wróblewski

Stale rośnie ilość publikowanych w Internecie informacji. Jakwynika z pierwszego przygotowanego przez Google, w 1998 roku, ilośćwitryn oscylowała wówczas w graniach 26 milionów. Na przestrzeniostatnich ośmiu lat widywaliśmy już wiele dużych liczb. Bilion jestogromną liczbą niepowtarzalnych adresów URL, a tyle właśnie, jaktwierdzi Google, zindeksowanych zostało w ich wyszukiwarce. Czy jednak tak duża ilość zindeksowanych dokumentów faktycznieoznacza ich istnienie i jaka jest liczba stron na całym świecie?Google z uśmiechem odpowiada, że nie wie, gdyż nie ma czasuspojrzeć na nie wszystkie. Ściślej mówiąc, ich liczba jest taknaprawdę nieskończona. Przykładowo miejsca zawierające tzw.automatycznie generowaną treść, jak kalendarze internetowe, wktórych obecne są linki do następnych dni, mogłyby być traktowaneza każdym razem jako nowa strona. Tak się jednak nie dzieje,ponieważ nie wynikają z tego żadne korzyści. Przykład ten pokazujetakże, że nie ma jednej definicji określającej co jest użytecznąwitryną, a co nie, aczkolwiek korporacja jest dumna z posiadanianajwiększego indeksu ze wszystkich wyszukiwarek, a jej celem jestzindeksowanie wszystkich danych świata. Dwaj inżynierowie Google, Jesse Alpert i Nissan Hajajlm, wspominająnatomiast same początki, kiedy Sieć nie była jeszcze tak duża i niekażdy miał do niej swobodny dostęp, co też wyraźnie przekładało sięna ilość publikowanych informacji. Wówczas bowiem jedna stacjarobocza była w stanie obliczyć wykres Page Rank na 26 milionów naprzestrzeni kilku godzin, a następnie wykorzystaniu takprzygotowanego zbioru przez określoną ilość czasu. Dzisiaj,wyszukiwarka giganta z Mountain View, na bieżąco indeksuje zasobysieci, gromadząc i aktualizując informacje o stronach,przetwarzając grafy połączeń wiele razy w ciągu dnia. Zdaniemkorporacji, wykres biliona adresów idealnie oddaje porównanie zmapą przedstawiającą identyczną ilość skrzyżowań. Zatem, abyprzedstawić ogrom pracy wykonywanej przez klastry obliczeniowe,Google za przykład podaje, iż każdorazowe obliczenie wykresu jestrównoważne z określeniem na mapie miasta skrzyżowania, które sąobecne na każdej drodze w Stanach Zjednoczonych, z tą różnicą, żemapa ta jest blisko 50 tysięcy razy większa od rzeczywistej mapyUSA z 50 tysiącami razy większą liczbą dróg i skrzyżowań. Niewątplwie wynik Google przyprawia zwykłego zjadacza chleba olekki ból głowy. Pozostaje mieć nadzieję, że firma nie spocznie nalaurach, wkraczając na coraz to nowsze rynki internetowego biznesu,świadcząc nowatorskie usługi, cenione przez użytkowników na całymświecie, pokroju Gmaila, świetnie realizującego model SaaS.

Udostępnij:
Wybrane dla Ciebie
Komentarze (28)