Środek Wikipedii

29.05.2008 3:46, Autor: Grzegorz Niemirowski (gniemirowski), Kategoria: News
NewsImage

Stephen Dolan dokonał ciekawej analizy linków na Wikipedii.

W jej wyniku stwierdził, że Wikipedia posiada 2301486 artykułów, które są połączone za pomocą 55 550 003 linków. 190 006 haseł jest niezlinkowanych. Hasłem, z którego najłatwiej jest się doklikać do innych jest "2007". Średnio potrzeba wykonać 3,45 kliknięcia aby dostać się ze strony o roku ubiegłym do każdej z pozostałych 2 111 479. Kolejne takie hasła to: "Deaths in 2004", "2006", "2004", "List of accidents and incidents on commercial aircraft", "Star Alliance destinations", "1990s", "List of town tramway systems in North America", "2005" i "1967". Jeśli odrzucimy strony z datami i listami haseł okaże się, że do dowolnego zlinkowanego miejsca w Wikipedii najłatwiej można się dostać z hasła "United Kingdom". Można więc powiedzieć, że jest to środek Wikipedii. Kolejne takie miejsca zajmują "Billie Jean King" i "United States". Dolan w swojej analizie nie sprawdzał do jakiego artykułu najłatwiej się dostać.

W analizie został wykorzystany plik zawierający wszystkie artykuły w Wikipedii tworzony co kilka miesięcy przez administratorów Wikipedii. Jest to 3,5 GB skompresowanego kodu XML, 150 GB po dekompresji. Przed właściwą analizą sparsowano ten plik aby wydobyć tylko niezbędne elementy. Co ciekawe 150 GB to także rozmiar skompresowanego pliku, który zawiera dodatkowo także dyskusje i historię edycji artykułów.

Źródło: Stephen Dolan
r   e   k   l   a   m   a

Komentarze (16)  

Avatar
junoreactor (niezalogowany) | 29.05.2008 7:49#1

potega

Avatar
roffik (niezalogowany) | 29.05.2008 8:16#2

"Dolan w swojej analizie nie sprawdzał do jakiego artykułu najłatwiej się dostać."
a jak niby miał to sprawdzić? przecież musiałby od czegoś zacząć - od strony głównej. a tam linki do konkretnych artykułów zmieniają się ciągle - co tydzień nowy zestaw!
ja wam powiem: jest to każde hasło jednoliterowe:P

Avatar
S99 (niezalogowany) | 29.05.2008 8:43#3

Oczywiście chodzi tu o angielską Wikipedię ;)

Avatar
ryfterek (niezalogowany) | 29.05.2008 8:48#4

Najłatwiej się dostać czyli chyba chodzi o ilość linków do danego tematu zawarte w całej wikipedii. Trzeba by sprawdzić który odnośnik do jakiego artykułu pojawia się najczęściej.
Idąc lekko na logikę skoro z hasła
"2007" oraz z nazwy "United Kingdom" można się dostać do największej ilości haseł to odwracając procej najczęściej można się dostać z innego artykułu do haseł "2007" oraz "United Kingdom".
Wszystkie drogi prowadzą do Rz... Do Zjednoczonego Królestwa w roku 2007. ;D

Avatar
nowak (niezalogowany) | 29.05.2008 8:49#5

wielkość otwartych rozwiązań

Avatar
SSEE (niezalogowany) | 29.05.2008 9:07#6

|
@nowak
„wielkość otwartych rozwiązań”


Możesz rozwinąć? Co ma do treści notki „otwartość”?
|

Avatar
piopry (niezalogowany) | 29.05.2008 9:10#7

oj panie niemirowski, widac ze artykul pisany o 3:40 nad ranem... ;) Nie lepiej sie wyspac i rano poskladac niusa ciut porzadniej?;)

Tak tylko glosno mysle... pozdrawiam :)

Avatar
Czytelnik (niezalogowany) | 29.05.2008 9:14#8

@ ryfterek
Niekoniecznie. Skoro coś "United Kingdom" linkuje do czegoś, to nie znaczy, że to coś linkuje do "United Kingdom".

Avatar
Jorge (niezalogowany) | 29.05.2008 9:26#9

U nas pewnie byłaby to Polska. Hmm, ale "W analizie został wykorzystany plik zawierający wszystkie artykuły w Wikipedii tworzony co kilka miesięcy przez administratorów Wikipedii." Administratorzy żadnych plików nie tworzą. Nie ma uprawnienia "Stwórz plik" ("prześlij plik", owszem jest dostępne dla zarejestrowanych) :D Raczej chodzi tu o developerów.

Avatar
Jorge (niezalogowany) | 29.05.2008 9:58#10

To niczego nie oznacza, ale...

http://en.wikipedia.org/wiki/Special:MostLinked

Fair Use i inne związane z prawem autorskim (pewnie dzięki ładowanym lokalnie grafikom) i USA, pewnie dzięki zabotowanym wioskom.

U nas

http://pl.wikipedia.org/wiki/Specjalna:Najcz%C4%99%C5%9Bciej_linkowane

Swoją drogą z chęcią poznałbym rozkład ilości uściśnięć dłoni.

Avatar
kuba (niezalogowany) | 29.05.2008 11:13#11

wielka,wolna encyklopedia jest super

Avatar
Gunther (niezalogowany) | 29.05.2008 12:17#12

@SSEE
Alergicznie reagujesz na to słowo?
Nie wiem, co miał na myśli nowak (jego komentarz zniknął?), ale słowo otwartość chyba dobrze opisuje charakter Wikipedii...

Avatar
gniemirowski (niezalogowany) | 29.05.2008 12:53#13

@piopry: rano to mialem kolokwium do napisania :)

Avatar
SSEE (niezalogowany) | 29.05.2008 13:54#14

|
@Gunther
„Alergicznie reagujesz na to słowo?
Nie wiem, co miał na myśli nowak (jego komentarz zniknął?), ale słowo otwartość chyba dobrze opisuje charakter Wikipedii...


Alergicznie? Zauważyłeś w moim komentarzu jakieś alergiczne („negatywne”?) nastawienie do czegokolwiek? Możesz napisać, w którym miejscu? ;)

Ja się tylko chciałem dowiedzieć, co ma wspólnego „otwartość” Wikipedii ze sprawą opisaną w notce. W jaki sposób „otwartość” Wikipedii wpłynęła na opisywaną analizę i dlaczego właśnie w tym kontekście owa „otwartość” zasługuje na tak wielką pochwałę, jaką obdarzył ją „nowak”. I tyle.
|

Avatar
Jorge (niezalogowany) | 29.05.2008 16:46#15

hmm, chyba chodzi o otwartość w szerszym znaczeniu - można pobrać bazę danych, nie jest to niedostępne.

Avatar
Marekkk (niezalogowany) | 29.05.2008 18:02#16

Oni tu muszą mieć serwery na to :P

masakra ^^.

Dodaj komentarz

Zasady publikowania komentarzy
Autor
Treść
 
Polecamy
Test Garmin Forerunner 610

Osobisty asystent treningowy
Huawei E583C

Test przenośnego routera 3G
Testujemy: Manta Smart TV Box

Internet w telewizorze
Recenzja Samsung NP530U4B

Ultabook z nadwagą
Top programy
  •  
Top programy ostatnie 7 dni
  •  
Top programy ostatnie 30 dni
  •  
Skanery antywirusowe
skaner av