Asystent Google nie przeszedł Testu Turinga – a czy w ogóle idzie we właściwą stronę?

Najważniejszy news mijającego tygodnia – Asystent Googleprzeszedł TestTuringa. Podczas konferencji Google I/O zaprezentowano AndroidDuplex, wykorzystaniu Asystenta Google do rozmów telefonicznych wnaszym imieniu, np. zarezerwowaniu stolika w restauracji czy wizyty ufryzjera. Poruszeni widzowie mogli doświadczyć charakterystycznychdla ludzkiej mowy pauz i wykrzykników namysłu. To wystarczyło, byzbiorowo orzeczono, że oto Android Duplex przeszedł Test Turinga,innymi słowy osiągnął w swojej komunikacji poziom pozwalający muudawać człowieka. Ale co na to sam Alan Turing, pomysłodawcatestu?

Adam Golański

13 maja 2018, 13:43

Dyrektor wykonawczy Google’a Sundar Pichai uruchomił Duplexa,prosząc Asystenta o umówienie porannego strzyżenia na wtorek.Sztuczna inteligencja zadzwoniła do salonu fryzjerskiego, którypodobno nic nie wiedział o prowadzonym eksperymencie. Korzystając zmodułu syntezy mowy, przeprowadziła 57-sekundową rozmowę, podczasktórej głosem młodej kobiety dogadała się z pracownicą salonuco do terminu i opcji. Faktycznie, brzmiało to całkiemprzekonująco: słowa pracownicy salonu spotykały się z sensownymi,spełniającymi cel rozmowy odpowiedziami.

WIDEO
Google Duplex: A.I. Assistant Calls Local Businesses To Make Appointments

Drugi pokaz był jeszcze bardziej przekonujący: męskim głosemAsystent próbował zarezerwować stolik dla czterech osób wrestauracji – i sensownie zareagował na odpowiedź pracownicy,która wyjaśniła, że nie musi rezerwować stolika, może przyjść,rezerwacje przyjmowane są dla grup od pięciu osób. Zrozumienieniuansów mowy? Niewątpliwie tak, przynajmniej z funkcjonalnegopunktu widzenia. Była to naprawdę przekonująca rozmowa, dalekowyprzedzająca wszystko to, co prezentują dziś Siri, Cortana czyAlexa. Przy cyfrowym asystencie Google’a to zwykłe papugi.

Jak osiągnięto ten postęp? To co obserwujemy to ogromnepostępny w dziedzinie rozumienia, interakcji, synchronizacji i mowy,możliwe dzięki rekurencyjnej sieci neuronowej (RNN), bazującej naalgorytmach TensorFlow uruchomionych na czipach TPU (TensorProcessing Unit). Sami inżynierowie Google’a wyjaśniająto następująco:

[quote]Trenowaliśmy RNN Dupleksa na zbiorzezanonimizowanych rozmów. Sieć korzysta z tego co na wyjściugoogle’owej technologii automatycznego rozpoznawania mowy (ASR),jak również właściwości dźwięki, historii rozmowy, parametrówrozmowy (np. potrzebnej usługi czy określonej pory dnia).Trenowaliśmy model rozumienia oddzielnie dla każdego zadania, alewykorzystaliśmy dla wszystkich zadań wspólny zbiór danych.Finalnie użyliśmy hiperparametrycznej optymalizacji z TensorFlowExtended, by jeszcze bardziej ulepszyć model.

[/quote]W efekcie powstał system zdolny do zaawansowanych rozmów iwykonania większości postawionych przed nim zadań całkowicieautonomicznie, bez ludzkiego zaangażowania. Gdy jednak rozpoznazadanie zbyt skomplikowane dla siebie, daje sygnał ludzkiemuoperatorowi, by ten przejął zadanie. System ten może też uczyćsię nowych dziedzin swoich operacji, wykorzystując nadzorowanytrening w czasie rzeczywistym – doświadczeni operatorzy służątu jako instruktorzy. Monitorują połączenia telefoniczne Duplexa wnowej dziedzinie i mogą wpływać na bieżąco na zachowania systemuw razie potrzeby. Robią to do momentu, aż osiągnięty zostanieoczekiwany poziom jakości i system będzie mógł samodzielniewykonywać połączenia.

To naprawdę fantastyczne osiągnięcie, które już dziś(przynajmniej w krajach anglojęzycznych) zapowiada bezrobocie dlawszystkich pracowników call center. Takie są przecież ich rozmowy:schematyczne interakcje w obrębie wskazanej dziedziny. Spróbujciedzwoniącemu z bankowego telecentrum zadać egzystencjalne pytanie,radzą sobie z tym równie źle, co czatboty. Pod tym względemDuplex, obficie korzystający z artefaktów ludzkiej mowy dlazmylenia rozmówcy (wywołania przekonania, że rozmawia zczłowiekiem), może w całości przejąć ludzkie zadania, wystarczygo wyćwiczyć. Póki co oszukał dwóch ludzi, dlaczego nie miałbyoszukać milionów?

Od oszukania dwóch ludzi do przejścia Testu Turinga droga jednakdaleka. Być może w ogóle poczynione tu kroki wcale nas niezbliżają do przejścia przez maszynę takiego testu. NiektórzyCzytelnicy mogą pamiętać niejakiego Eugene Goostmana, czatbotaudającego trzynastoletniego chłopca z Ukrainy, który w 2014 rokumiał jako pierwszy przejść test Turinga – jak to wówczasstwierdziły media.

Czatbot, który bredził po angielsku, udając ukraińskiego chłopca. Podobno kogoś oszukał.

Przypomnijmy jednak, czym jest Test Turinga. Sam wielki matematykwymyślił go w swoim klasycznymartykule z 1950 roku, Computing Machinery and Intelligence.Zaproponował, aby zamiast zastanawiać się, czy maszyna możemyśleć, zastanowić się, czy maszyna może wygrać towarzyską gręw naśladownictwo.

W oryginalnej wersji gry w naśladownictwo uczestniczą trzejgracze: A jest mężczyzną, B jest kobietą, a C odgrywającyśledczego może być dowolnej płci. Gracz C nie widzi graczy A i B,komunikuje się z nimi tylko drogą tekstową, nic nie wie też o A iB, zna ich jedynie pod literami „X” i „Y”. Zadając pytaniagraczom A i B, gracz C próbuje odkryć, które z pytanych jestmężczyzną a które kobietą, zadając im rozmaite pytania o nichsamych i ich rozumienie świata. Ale uwaga: zadaniem gracza A jestoszukać śledczego, podczas gdy gracz B próbuje pomóc śledczemu wpoprawnym rozpoznaniu ich płci.

Schemat testu Turinga – gry w naśladownictwo (źródło: Wikimedia, CC BY 2.5)

Turing zapytał: a co by się stało, gdyby gracza A zastąpićmaszyną? Czy śledczy równie często popełniałby błąd jakwówczas gdy gra jest rozgrywana między mężczyzną i kobietą? Wzmodyfikowanej wersji zabaw mamy więc trzech oddzielonych od siebieuczestników: komputer, człowieka oraz ludzkiego śledczego. Śledczyrozmawia zarówno z człowiekiem jak i maszyną poprzez terminaltekstowy. Komputer kłamie, że jest człowiekiem. Człowiekprawdziwie przekonuje, że jest człowiekiem. Jeśli sędzia nie jestw stanie powiedzieć, które z nich jest człowiekiem, a którekomputerem, wówczas można powiedzieć, że maszyna przeszła testTuringa.

Oczywiście test ten w żaden sposób nie mówi, czy komputer możemyśleć. Mówi jedynie o pewnej sprawności w naśladowaniu zachowańczłowieka, mowy traktowanej jako zbiór performatywnych aktów. Nawielu frontach krytykuje się jednak zasadność samego testu nawet ido oceny sprawności oszukiwania, ale to już temat wychodzący pozatematykę tego felietonu. Istotne jest to, że Alan Turing poczyniłpewną prognozę. Stwierdził mianowicie:

[quote]Wierzę, że za około 50 lat stanie się możliwe programowaniemaszyn cyfrowych o pojemności pamięci rzędu 109 tak, aby grały wgrę w naśladownictwo tak dobrze, że przeciętny pytający popięciu minutach zadawań pytań nie będzie miał więcej niż 70procent szansy dokonania prawidłowej identyfikacji.

[/quote]Śmiała prognoza, która jak widać, nie spełniła się. W 2018roku żaden sztuczny system, włącznie z czatbotem Eugene Goostmanemi Google Duplexem nie jest w stanie przetrwać przez pięć minutpytań ludzkiego śledczego, starającego się odkryć, czy ma doczynienia z człowiekiem czy maszyną. Nic jeszcze nie przeszłoTestu Turinga, choć zasugerowane przez wielkiego matematyka ścieżkirozwijania sztucznych inteligencji (np. poprzez algorytmy genetyczne)zostały faktycznie podjęte np. w budowaniu programów szachowych.

Dlatego bez zbędnych nadziei czy obaw – osiągnięcia Google’a,choć inżynieryjnie bardzo ciekawe i znaczące, w dziedzinie samychpodstaw sztucznej inteligencji nic nie zmieniają. A właściwie tosprawiają wrażenie, że za chwilę wpadniemy na kolejną ścianę,i rozpocznie się kolejna długa zima w AI. Pomyślcie o tym tak:jeszcze nigdy takie pieniądze i tyle wysiłku nie poszło w pracenad sztuczną inteligencją. Tymczasem do dzisiaj nie osiągniętoniczego poza coraz sprawniejszą klasyfikacją danych i wzorcówwedług wyćwiczonych reguł. Mamy po prostu coraz lepszychsztucznych idiotów. Czy dalsze ich doskonalenie może zbliżyć nasdo maszynowego myślenia?

Adam Golański