Sztuczna inteligencja pokonała inne programy w szachy, szogi i Go

Sztuczna inteligencja pokonała inne programy w szachy, szogi i Go07.12.2018 14:43
Sztuczna inteligencja pokonuje inne programy w szachy i Go

Przez wiele lat prace nad sztuczną inteligencją skupiały się wokół wytrenowania modelu, który pokona graczy z krwi i kości w strategiczne gry planszowe. Te czasy już minęły. Pojedynki w szachy, Go i szogi przeniosły się na poziom, na którym programy walczą ze sobą.

Zespół DeepMind, należący do Alphabet Inc., ma na tym polu kolejne osiągnięcie. Jego nowa sztuczna inteligencja, nazwana AlphaZero, sama nauczyła się grać w trzy gry planszowe i ma na tym polu spore sukcesy. Pokonała innych komputerowych mistrzów w szachy, Go i szogi. AlphaZero jest ulepszoną wersją AlphaGo – sztucznej inteligencji, która została mistrzem Go.

Proces nauki AlphaZero odbywał się bez interwencji ludzi. Z artykułu podsumowującego doświadczenia możemy dowiedzieć się, że SI otrzymała jedynie zestaw podstawowych zasad każdej z gier. Grać w szachy uczyła się dziewięć godzin, w szogi dwanaście, a w Go 13 godzin. Wynik jest imponujący, ale należy odnieść go do odpowiedniej skali. AlphaZero wykorzystuje moc 5000 TPU (Tensor Processing Unit), a każda jednostka jest w stanie przetworzyć milion zdjęć z Google Photos w ciągu doby. Sukces uniwersalnej SI w kilku grach jest ważnym krokiem, ale bardzo też kosztownym.

Decyzję o kolejnym ruchu AlphaZero podejmuje z użyciem heurystyki Monte Carlo Search Tree (MCST), typowej dla znajdowania najlepszego ruchu w grach turowych, niedeterministycznych i grach czasu rzeczywistego.

Następnie AlphaZero zmierzyła się z najlepszymi botami w każdej z dyscyplin. W szachy grała z programem StockFish, zbierającego najwyższe noty w rankingu CCRL. Na tysiąc rozegranych partii AlphaZero przegrała jedynie sześć, wygrała zaś 155. Pozostałe skończyły się remisem.

Szogi, czyli japońskie szachy, są grą trudniejszą od szachów, rozgrywaną na większej planszy i większym zestawem figur. AlphaZero już po dwóch godzinach treningu miała wyniki nieco lepsze do komputerowego mistrza z 2017 roku – programu elmo. Gdy po 9 godzinach treningu zmierzyła się z elmo, wygrała aż 91,2 proc. gier.

Najbardziej złożoną grą, jakiej uczyła się AlphaZero, jest Go. W tej wspaniałej konkurencji nowa SI zmierzyła się ze swoją starszą siostrą – AlphaGo. Młodszy i bardziej uniwersalny program zwyciężył w 61 proc. gier.

wyniki AlphaZero w trzech grach
wyniki AlphaZero w trzech grach

Na koniec warto dodać, że styl gry AlphaZero został pochwalony przez samego Garriego Kasparowa. Zauważył on, że programy szachowe zwykle dążą do perfekcji, wykonując ostrożne manewry, które zwykle prowadzą do remisu. AlphaZero potrafi zagrać agresywnie lub ryzykownie i przedkłada aktywność nad ochronę figur. W połączeniu z możliwością opanowania wielu gier czyni to z Alpha Zero solidną podstawę do opracowania uniwersalnego przeciwnika komputerowego.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.