Parsoid: pierwsze kroki Wikipedii w stronę szerszego wykorzystania HTML

Parsoid: pierwsze kroki Wikipedii w stronę szerszego wykorzystania HTML05.03.2013 13:48

Pierwsi redaktorzy Wikipedii chcieli dobrze – na początku tegostulecia znajomość HTML nie była umiejętnością powszechną,mało kto też dobrze wykorzystywał arkusze stylów do budowanialayoutów stron i formatowania treści. Dlatego też stworzeniewłasnego języka znaczników do formatowania artykułów wredagowanej przez internetową społeczność encyklopedii byłopomysłem dobrym.12 lat później sytuacja wygląda zgoła odmiennie. Z jednejstrony przynajmniej podstawowa znajomość HTML nie jest niczymrzadkim wśród zainteresowanych internautów, z drugiej zaś samWikitext – język znaczników używany w Wikipedii – stał się ogromnieskomplikowany, i nawet doświadczeni wikipedyści mają problemy zpoprawnym jego stosowaniem, gubiąc się w tych wszystkichapostrofach. Co gorsza, ten język znaczników praktycznieuniemożliwia wprowadzenie do Wiki wizualnego edytora WYSIWYG, dziśoczekiwanego przez internautów niemal w każdej popularnej webowejaplikacji. [img=wiki]Dodatkowo trzeba pamiętać, że i tak oprogramowanie MediaWiki,na którym Wikipedia działa, musi te wszystkie dokumenty zapisaneWikitekstem przekonwertować do HTML, by były zrozumiałe dlaprzeglądarek. Tym zajmuje się w miarę prosty skrypt PHP,jednak przy obecnej liczbie edycji dokonywanych w internetowejencyklopedii, coraz wyraźniej widać jegoniewystarczającą wydajność. Gabriel Wicke pisze na łamachbloga Fundacji Wikimedia, że konwersja dużego artykułu zWikitekstu na HTML może zająć nawet 40 sekund.Idealnie byłoby całkowicie zrezygnować z Wikitekstu,przechowywać zawartość artykułów wyłącznie w HTML.Pozwoliłoby to zaoszczędzić miejsce i łatwo wprowadzić wizualnyedytor, czemu więc tego do tej pory nie zrobiono? Problemem, opróczzachowania zgodności z ogromną bazą istniejących dokumentówjest zachowanie możliwości bezstratnej konwersji międzyWikitekstem a HTML, tak by przekształcenie dokumentu z jednej wersjina drugą nie wprowadzało żadnych semantycznych różnic.Niestety jednak konwersja między Wikitekstem a HTML nie jest prosta. Po pierwsze, parser musiałbysobie poradzić ze złożoną, wykorzystującą wyrażenia regularneheurystyką przekształceń stylów, czyniącą tradycyjne technikiparsowania niemożliwymi do zastosowania, po drugie problemem jestskomplikowany system szablonów i preprocesor tekstów, który niedaje żadnej gwarancji, że na wyjściu uzyskamy dobrze zbudowanyfragment dokumentu HTML, po trzecie trzeba zapewnić, że każdyWikitext będzie przekształcony do poprawnego HTML (nie ma czegośtakiego jak błąd składniowy Wikitekstu), po czwarte wreszcie –znajdowanie różnic w edycjach tego samego dokumentu w Wikitekściejest znacznie łatwiejsze, niż w wypadku HTML.[img=parsoid]Rozwiązaniem tych bolączek ma być Parsoid, webowa usługapozwalająca na konwersję w obie strony między Wikitekstem i HTML5,a napisana na bazie frameworka Node.js. Na początku Parsoid posłużyjako podstawa działania projektu VisualEditor,a w przyszłości możne nawet pozwoli na wykorzystanie HTML jakogłównego formatu przechowywania dokumentów w oprogramowaniuMediaWiki. Na razie programiści Wikimediów będą starali sięraczej utrzymać równolegle systemy przechowywania dokumentów w obuformatach.Zainteresowanych tym, jak działają obie części Parsoida –konwerter wykorzystujący proces tokenizacji na bazie formalnychgramatyk do przekształcenia Wikitekstu w HTML, oraz konwerterprzeprowadzający serializację HTML, byprzekształcić go na Wikitext – zapraszamy do zapoznaniasię z wpisemna blogu Wikimediów. Niezainteresowanych zresztą teżzapraszamy, gdy następnym razem będziecie czytali coś wWikipedii, odczujecie wyraźniej, jak bardzo skomplikowanym systememjest MediaWiki.

Źródło artykułu:www.dobreprogramy.pl
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.