r   e   k   l   a   m   a
r   e   k   l   a   m   a

Superkomputer od IBM uczy ludzi pisać. Można już testować Tone Analyzera

Strona główna AktualnościOPROGRAMOWANIE

W 2006 roku powstała pierwsza wersja stworzonego przez IBM superkomputera Watson. Jedną z jego najważniejszych właściwości jest to, że jest on w stanie analizować język, jakim porozumiewają się ludzie. Według IBM kompetencje Watsona w tym zakresie są tak wysokie, że może on nawet poprawiać człowieka – udostępniono testową wersję usługi Tone Analyzer, której zadaniem jest doskonalenie stylu wypowiedzi.

Watson ma na swoim koncie całkiem imponujące osiągnięcia. W 2011 roku superkomputer wziął udział w teleturnieju Jeopardy! opierającego się na formule odwróconego procesu sprawdzania wiedzy – gracz musi zadać pytanie do usłyszanej od prowadzącego odpowiedzi. Konkurentami Watsona byli najbardziej utytułowani uczestnicy Jeopardy!, co nie przeszkodziło superkomputerowi w zdeklasowaniu ich poprzez zdobycie niemal trzykrotnie większej liczby punktów.

Założeniem wykorzystującego możliwości Watsona Tone Analyzera, była możliwość przeanalizowania wpisanego tekstu pod kątem odcienia emocjonalnego wypowiedzi. Przetłumaczenie nazwy narzędzia na polski, mogłoby zatem być mylące, gdyż nie ma ono nic wspólnego z analizą dźwięku – materiałem może być jedynie tekst. Dzięki ogromnemu zasobowi słownictwa superkomputera Watson, Tone Analyzer wydziela słowa i przydziela im odpowiednią kategorię, którą dla uproszczenia nazwijmy jednak tonem.

r   e   k   l   a   m   a

Analyzer rozróżnia trzy tony wypowiedzi: emocjonalny, społeczny i literacki. Łatwo można zauważyć, że w rzeczywistości chodzi tu tak konkretne funkcje użytych jednostek słownikowych. Każdy ton ma swoje warianty. Emocjonalny może mieć odcień negatywny, wściekły lub wesoły. W kategoriach społecznych możliwe jest użycie słów, które zostaną później przyporządkowane do otwartych, ugodowych bądź skrupulatnych. Ostatnią kategorią jest literackość języka: analityczność, niepewność lub pewność.

Przyjęcie założenia, że z punktu widzenia nauk językoznawczych taka kategoryzacja ma jakiekolwiek uzasadnienie, nie będzie łatwe. Niemniej aby zrozumieć problem, konieczna będzie generalizacja i zaakceptowanie zasad IBM-u, gdyż właśnie w takich kategoriach analizuje Watson. Tone Analyzer prezentuje wyniki sugerując synonimy wyrazów zinterpretowanych przez siebie jako posiadające negatywny wydźwięk. Celem jest oczywiście jak najmniejszy odsetek „negatywnych” słów.

Diabeł tkwi w szczegółach, jednak Watson popełnia niewybaczalny błąd – analizuje tekst tylko na poziomie leksykalnym, tj. ocenia ton pojedynczych słów. Nietrudno się domyślić zatem, że oszukać superkomputer jest dziecinnie prosto. Na przykład stosując zaprzeczenie:

Użycie w wypowiedzeniu zaprzeczonego słowa o negatywnym odcieniu, było dla niego materiałem na potencjalną poprawkę. Szczególnie interesująco wypada to w analizie procentowej zawartości emocjonalnej wypowiedzenia: według Watsona neutralne, a nawet pozytywne nie ma w tym nic złego jest w 37% złożone ze słów o negatywnym tonie.

Analiza dokonana przez Watsona jest tak uboga z powodu swojej płytkości, a to zaś wynika z ubogości na poziomie oprogramowania. Superkomputer, który zmiażdżył konkurentów w teleturnieju sprawdzającym wiedzę, został zaprogramowany tak, aby brał pod uwagę zaledwie 25% wypowiedzenia, czyli tylko jeden z czterech poziomów systemu językowego. A zatem programiści z IBM wyszli z założenia, że do udoskonalenia (czy też uczynienie wypowiedzi bardziej „pozytywną”) wystarczy jej modyfikacja na poziomie leksykalnym, zamiana słów ich synonimami o mniej negatywnym odcieniu. Z pustego i Watson nie naleje.

Przedwczesne byłoby jednak stwierdzenie, że Tone Analyzer jest całkowicie nieprzydatny. Przede wszystkim jest on kopalnią synonimów, na ogół całkiem trafnych. A zatem, podczas formułowania wypowiedzi złożonych ze słów, które otrzymały kategorię literackości, może on całkiem skutecznie wzbogacić słownictwo. Nie chodzi tutaj bynajmniej o wykorzystywanie go przez młodszych do „nauki słówek”, a raczej dodanie do swojego zasobu słownictwa synonimów jednostek o bardziej wykwintnym zabarwieniu. Czy taka metoda będzie skuteczna można przekonać się na stronie testowej wersji Tone Analyzera.

© dobreprogramy

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.