Test Turinga ma wartość tylko historyczną, czas oceniać AI za pomocą Testu Lovelace

Wymyślony przez Alana Turinga test (jego imienia), mający wzałożeniach dowieść opanowania przez maszynę umiejętnościmyślenia przez nią w sposób podobny do ludzkiego, nie spełniłpokładanych w nim nadziei. Pomijając już same wątpliwefilozoficznie założenia testu, rozwój programów konwersacyjnych,tzw. czatbotów pokazał, że można stworzyć program, który będziew miarę sprawnie prowadził rozmowę z człowiekiem, w żaden sposóbnie rozumiejąc znaczeń i kontekstów użytych słów. Ewentualneniedociągnięcia zawsze można zrzucić na młody wiek czypochodzenie udawanej osoby ludzkiej – jak to było w wypadkuczatbota EugeneGoostman, udającego nastolatka z Ukrainy. Dla każdegozainteresowanego tematem słabość testu jest jednak ewidentna. Jakwięc wykryć myślenie u maszyn? Bardzo ciekawą propozycjęprzedstawił Selmer Bringsjörd, profesor informatyki ikognitywistyki z Rensselaer Polytechnic Institute w Nowym Jorku.Zapoznajcie się z będącym dziełem jego i kolegów TestemLovelace.

W teście Turinga chodzi o nic innego jak skuteczne oszukiwanie.Maszyna wcale nie musi myśleć – by przejść test, programistamusi stworzyć dla niej taki program, który pozwoli jej oszukaćinną ludzką istotę, przekonać ją, że ma w rozmowie do czynieniaz człowiekiem. Przejście testu Turinga może oczywiście oznaczać,że maszyna posiadła zdolność myślenia, ale jak do tej poryoznacza jedynie, że posiada zdolność sprawnej mimikry językowej –układania słów i zdań w przekonujący sposób.

Obraz

Formalne metody wykrycia procesu myślenia w maszynie nie mogąbyć, zdaniem wielu badaczy, powiązane z ludzkim językiem –inaczej kończy się to wszystko wyścigiem w budowaniu corazlepszych czatbotów. Nie, żeby prace takie były bezwartościowe,nieinteligentne oprogramowanie, zdolne do akceptowalnej przezużytkownika komunikacji werbalnej w określonych tematach jestpożądanym celem dla każdego projektanta interfejsów użytkownika,ale są to właśnie badania z zakresu interfejsów użytkownika, anie sztucznej inteligencji. Teraz, po sukcesie Eugene Goostmana,który pokazał, że test Turinga w obszarze badań nad AI ma już tylkowartość historyczną, przypomniano sobie o innym teście, któryujmuje kluczowe aspekty ludzkiego myślenia.

W 2001 roku Selmer Bringsjörd, wraz z zespołem informatyków, zaproponował nowe podejście do tematu testów AI. Warto nadmienić, że w jego zespole był David Ferucci, jeden z czołowych projektantówsuperkomputera IBM Watson (tego, który wygrał teleturniej Va banque). Wymyślony test otrzymał nazwę po Adzie Lovelace, pierwszejprogramistce w historii, która w 1843 roku stwierdziła, że maszynynigdy nie będą tak inteligentne jak ludzie, ponieważ mogą robićtylko to, co zostało przez nas zaprogramowane. Dopóki maszyna niestworzy myśli, do której nie została zaprogramowana, nie może byćuważana za inteligentną w takim sensie, jak ludzie.

Oprogramowanie może przejść Test Lovelace dopiero wówczas,jeśli stworzy dowolną treść, inne oprogramowanie, czy wręczdzieło sztuki, do którego stworzenia nie zostało zaprogramowane.Proces twórczy nie może być dziełem przypadku, a więc musi byćodtwarzalny na żądanie prowadzących eksperyment. Co więcej,projektanci kandydującego do miana „inteligentnego”oprogramowania nie mogą być w stanie wyjaśnić, jak oryginalny koddoprowadził do stworzenia czegoś nowego.

Warunek taki wydaje się nie do przejścia, a jednak w 2011 rokuGoogle jako pierwsze pochwaliłosię oprogramowaniem, które w pewnym ograniczonym sensie mogłobyprzejść Test Lovelace. Klaster 16 tysięcy procesorówwykorzystany został do przeanalizowania 10 milionów miniaturekklipów wideo, by na tej podstawie nauczyć się rozpoznawaćwizerunki kotów. Co ważne, system nie był trenowany przezczłowieka, nigdy nie otrzymał komunikatu „oto kot”. Kolejnaiteracja systemu rozpoznawania obrazu nauczyła się klasyfikowaćznacznie trudniejsze do rozpoznania obiekty – niszczarkidokumentów. Wówczas to szef projektu w Google, Quoc V. Le,ogłosił, że komputerowy system rozpoznawania obrazu poradziłsobie z tym zadaniem znacznie lepiej, niż ludzie, a on sam nie wie,jak napisać program, który by samouczącemu się inteligentnemuklasyfikatorowi dorównał.

Oczywiście nawet takiemu systemowi daleko do przejścia TestuLovelace w oryginalnym sensie. Większość istotnych form ludzkiegomyślenia bardzo słabo się algorytmizuje (o ile w ogólealgorytmizacja jest możliwa). To nie tylko tak „ludzkie”wydawałoby się kwestie jak ocena dzieła sztuki, ale też sprawyznacznie bardziej formalne, jak dowodzenie twierdzeń matematycznych.Jak wyjaśnia Bringsjörd, wartością Testu Lovelace jest dziśprzede wszystkim przedstawienie stanu badań nad sztucznąinteligencją we właściwej perspektywie.

Nie oznacza to z konieczności pesymizmu co do możliwościbudowania Sztucznych Inteligencji. Zdaniem uczonego, w dziedziniebadań nad AI jest jeszcze bardzo wiele do zrobienia, szczególnie wnajbardziej praktycznych kwestiach, takich jak choćby samoprowadzącesię auta. Uniwersalne, kreatywne AI, to wciąż tylko obszarfantastyki – i nie widać żadnych perspektyw na to, by sytuacjauległa zmianie.

Źródło artykułu: www.dobreprogramy.pl
Wybrane dla Ciebie
Windows 11 z nową aktualizacją. Poprawi m.in. Eksplorator plików
Windows 11 z nową aktualizacją. Poprawi m.in. Eksplorator plików
Linux 7.1 RC2 dostępny. Poprawki KVM i narzędzia AI
Linux 7.1 RC2 dostępny. Poprawki KVM i narzędzia AI
Ministerstwo Cyfryzacji: 355 mln zł na chmurę rządową i cyfrową tożsamość
Ministerstwo Cyfryzacji: 355 mln zł na chmurę rządową i cyfrową tożsamość
Microsoft usuwa pasek boczny z Edge'a. Copilot zostaje
Microsoft usuwa pasek boczny z Edge'a. Copilot zostaje
Windows 10 u co czwartego gracza. Nowe dane Steam
Windows 10 u co czwartego gracza. Nowe dane Steam
Wiadomość o nadpłacie za gaz. Podszywają się pod Orlen
Wiadomość o nadpłacie za gaz. Podszywają się pod Orlen
Zapowiedź zmian w mObywatelu. Rewolucja dla kierowców
Zapowiedź zmian w mObywatelu. Rewolucja dla kierowców
Odpalił Dooma w... chatbocie. Ty też możesz
Odpalił Dooma w... chatbocie. Ty też możesz
YouTube włącza PIP dla wszystkich użytkowników
YouTube włącza PIP dla wszystkich użytkowników
Kabel USB-C: co sprawdzić przed zakupem?
Kabel USB-C: co sprawdzić przed zakupem?
Aktualizacja KSeF 2.0. Pozwala zgłaszać fałszywe faktury
Aktualizacja KSeF 2.0. Pozwala zgłaszać fałszywe faktury
Nowość w Uberze. Rośnie konkurencja dla Booking
Nowość w Uberze. Rośnie konkurencja dla Booking
MOŻE JESZCZE JEDEN ARTYKUŁ? ZOBACZ CO POLECAMY