Słowosieć 2.0 z rzutowaniem znaczeń na WordNet

Słowosieć 2.0 z rzutowaniem znaczeń na WordNet

08.02.2013 13:47, aktualizacja: 08.02.2013 15:52

Osoby zainteresowane językiem angielskim, słownikami lub naukami kognitywnymi z pewnością trafiły kiedyś na projekt WordNet — tworzoną na Uniwersytecie Princeton bazą leksykalną, która porządkuje słowa języka angielskiego według ich relacji semantycznych, leksykalnych i koncepcyjnych. WordNet można wykorzystać na różne sposoby, między innymi jako skrzyżowanie słownika z tezaurusem (wersja webowa, znaleźć go można również w różnych słownikach) lub jako podstawa dla automatycznej analizy, gdyż baza jest dostępna na licencji WordNet 3.0. Słowosieć to polska wersja bazy WordNet tworzona na Politechnice Wrocławskiej, a dziś we Wrocławiu ma miejsce konferencja z okazji premiery jej wersji 2.0.

Węzłami Słowosieci są poszczególne znaczenia wyrazów, które połączone są ściśle określonymi relacjami semantycznymi — na przykład „wesoły” i „radosny” to synonimy, zaś „smutny” to ich antonim, „kot” jest hiponimem „zwierzę”, „oko” jest meronimem „głowa” i tak dalej. W Słowosieci znajduje się obecnie 106 tysięcy wyrazów, które łączy ponad 400 tysięcy relacji i jest to jeden z najbardziej rozbudowanych, sformalizowanych systemów opisu relacji znaczeniowych języka polskiego, jaki kiedykolwiek powstał. Ponadto, polscy lingwiści i informatycy opracowali nieco bardziej zaawansowany od princetońskiego i unikalny w skali światowej model relacji. Słowosieć rozmiarem dorównuje już WordNetowi i w przeciwieństwie do niektórych innych baz tego typu, nie jest tłumaczeniem z wersji angielskiej.

Obraz

Skoro jest nowa wersja, są też ciekawe zmiany. Około 50 tysięcy jednostek ze Słowosieci zostało zrzutowanych na WordNet princetoński, dzięki czemu powstała sieć semantyczna przypominająca słownik dwujęzyczny, ale określająca relacje bezpośrednio między znaczeniami. Rzutowanie objęło znaczenia z kategorii skupiających miejsca, relacje rodzinne, produkty spożywcze, jednostki czasu i nazwy dziedzin wiedzy. Licencja Słowosieci bazuje na licencji WordNet. Pełną bazę w wersji 2.0 można już pobrać lub przeglądać na stronie plWordNet.

Z WordNetem wiąże się jeszcze jedna, niestety smutna wiadomość. George A. Miller, pionier psychologii kognitywnej, który w latach osiemdziesiątych ubiegłego wieku zapoczątkował prace nad bazą, zmarł 22 lipca ubiegłego roku w wieku 92 lat.

Programy

Zobacz więcej
Źródło artykułu:www.dobreprogramy.pl
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (6)