Superkomputer od IBM uczy ludzi pisać. Można już testować Tone Analyzera

Superkomputer od IBM uczy ludzi pisać. Można już testować Tone Analyzera22.07.2015 15:55

W 2006 roku powstała pierwsza wersja stworzonego przez IBM superkomputera Watson. Jedną z jego najważniejszych właściwości jest to, że jest on w stanie analizować język, jakim porozumiewają się ludzie. Według IBM kompetencje Watsona w tym zakresie są tak wysokie, że może on nawet poprawiać człowieka – udostępniono testową wersję usługi Tone Analyzer, której zadaniem jest doskonalenie stylu wypowiedzi.

Watson ma na swoim koncie całkiem imponujące osiągnięcia. W 2011 roku superkomputer wziął udział w teleturnieju Jeopardy! opierającego się na formule odwróconego procesu sprawdzania wiedzy – gracz musi zadać pytanie do usłyszanej od prowadzącego odpowiedzi. Konkurentami Watsona byli najbardziej utytułowani uczestnicy Jeopardy!, co nie przeszkodziło superkomputerowi w zdeklasowaniu ich poprzez zdobycie niemal trzykrotnie większej liczby punktów.

Założeniem wykorzystującego możliwości Watsona Tone Analyzera, była możliwość przeanalizowania wpisanego tekstu pod kątem odcienia emocjonalnego wypowiedzi. Przetłumaczenie nazwy narzędzia na polski, mogłoby zatem być mylące, gdyż nie ma ono nic wspólnego z analizą dźwięku – materiałem może być jedynie tekst. Dzięki ogromnemu zasobowi słownictwa superkomputera Watson, Tone Analyzer wydziela słowa i przydziela im odpowiednią kategorię, którą dla uproszczenia nazwijmy jednak tonem.

Analyzer rozróżnia trzy tony wypowiedzi: emocjonalny, społeczny i literacki. Łatwo można zauważyć, że w rzeczywistości chodzi tu tak konkretne funkcje użytych jednostek słownikowych. Każdy ton ma swoje warianty. Emocjonalny może mieć odcień negatywny, wściekły lub wesoły. W kategoriach społecznych możliwe jest użycie słów, które zostaną później przyporządkowane do otwartych, ugodowych bądź skrupulatnych. Ostatnią kategorią jest literackość języka: analityczność, niepewność lub pewność.

Przyjęcie założenia, że z punktu widzenia nauk językoznawczych taka kategoryzacja ma jakiekolwiek uzasadnienie, nie będzie łatwe. Niemniej aby zrozumieć problem, konieczna będzie generalizacja i zaakceptowanie zasad IBM-u, gdyż właśnie w takich kategoriach analizuje Watson. Tone Analyzer prezentuje wyniki sugerując synonimy wyrazów zinterpretowanych przez siebie jako posiadające negatywny wydźwięk. Celem jest oczywiście jak najmniejszy odsetek „negatywnych” słów.

Diabeł tkwi w szczegółach, jednak Watson popełnia niewybaczalny błąd – analizuje tekst tylko na poziomie leksykalnym, tj. ocenia ton pojedynczych słów. Nietrudno się domyślić zatem, że oszukać superkomputer jest dziecinnie prosto. Na przykład stosując zaprzeczenie:[img=2015-07-2213_54_16-ToneAnalyzer]Użycie w wypowiedzeniu zaprzeczonego słowa o negatywnym odcieniu, było dla niego materiałem na potencjalną poprawkę. Szczególnie interesująco wypada to w analizie procentowej zawartości emocjonalnej wypowiedzenia: według Watsona neutralne, a nawet pozytywne nie ma w tym nic złego jest w 37% złożone ze słów o negatywnym tonie.

Analiza dokonana przez Watsona jest tak uboga z powodu swojej płytkości, a to zaś wynika z ubogości na poziomie oprogramowania. Superkomputer, który zmiażdżył konkurentów w teleturnieju sprawdzającym wiedzę, został zaprogramowany tak, aby brał pod uwagę zaledwie 25% wypowiedzenia, czyli tylko jeden z czterech poziomów systemu językowego. A zatem programiści z IBM wyszli z założenia, że do udoskonalenia (czy też uczynienie wypowiedzi bardziej „pozytywną”) wystarczy jej modyfikacja na poziomie leksykalnym, zamiana słów ich synonimami o mniej negatywnym odcieniu. Z pustego i Watson nie naleje.

Przedwczesne byłoby jednak stwierdzenie, że Tone Analyzer jest całkowicie nieprzydatny. Przede wszystkim jest on kopalnią synonimów, na ogół całkiem trafnych. A zatem, podczas formułowania wypowiedzi złożonych ze słów, które otrzymały kategorię literackości, może on całkiem skutecznie wzbogacić słownictwo. Nie chodzi tutaj bynajmniej o wykorzystywanie go przez młodszych do „nauki słówek”, a raczej dodanie do swojego zasobu słownictwa synonimów jednostek o bardziej wykwintnym zabarwieniu. Czy taka metoda będzie skuteczna można przekonać się na stronie testowej wersji Tone Analyzera.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.