r   e   k   l   a   m   a
r   e   k   l   a   m   a

W 70 godzin od zera do arcymistrza: AlphaGo Zero pokazuje potencjał AI

Strona główna AktualnościOPROGRAMOWANIE

Ludzie nie mają już żadnych szans w go. O ile najwięksi mistrzowie tej gry, tacy jak Lee Sedol czy Ke Jie mogli przynajmniej próbować grać z AlphaGo, sztuczną inteligencją należącego do Google startupu DeepMind, to nowa wersja AlphaGo w swojej grze wychodzi już poza naszą skalę. Złożoność gry rzędu 10^360 nie stanowi już dla maszynowego intelektu żadnej przeszkody.

Zespół badaczy DeepMind opublikował w Nature artykuł pt. Mastering the game of Go without human knowledge, opisujący działanie sztucznej inteligencji AlphaGo Zero, następcy wycofanego już mistrzowskiego AlphaGo. Celem jej powstania było zbadanie, co może system, który uczy się całkowicie bez ludzkiego udziału. Niespodziewanie dla siebie, rezygnując z ludzkiego pierwiastka, DeepMind stworzył najlepszego gracza go w historii.

Dlaczego najlepszego? Po swoim okresie samodzielnego treningu, AlphaGo Zero wystawiono przeciwko poprzedniemu czempionowi, AlphaGo, w meczu stu gier. Alpha Go Zero wygrał stosunkiem 100:0, stosując przy tym strategie, jakich nigdy wcześniej jeszcze nie widziano w grach między ludźmi. Dla nowego czempiona ludzka wiedza i umiejętności nie są już żadnym wartym uwagi wskaźnikiem, może on grać już tylko sam ze sobą.

r   e   k   l   a   m   a

W nowej wersji AI zastosowano innowacyjną formę uczenia przez wzmacnianie, w której AlphaGo Zero stało się swoim własnym nauczycielem. Początkowo sieć neuronowa nic nie wiedziała o grze. Rozgrywając gry przeciwko samej sobie, łączyła swoją sieć z wydajnym algorytmem wyszukiwania. Dostrajał on sieć pod kątem przewidywania ruchów i wskazywania zwycięzcy.

Wyćwiczona tak AI, w połączeniu z algorytmem wyszukiwania, tworzyła nową, silniejszą wersję AlphaGo Zero, powtarzając proces gry ze sobą. Iteracja po iteracji rosła wydajność systemu i jakość rozgrywanych gier. Napędzane nowym hardware AI (zamiast pierwotnych 176 procesorów graficznych Nvidii, jedynie cztery TPU – tensorowe jednostki obliczeniowe Google’a), stosując liczne uproszczenia w architekturze, osiągnęło znacznie wyższy poziom ogólności swojej inteligencji.

Alpha Go Zero nie potrzebuje już więc żadnych dodatkowych informacji poza ustawieniem kamieni na planszy. Korzysta też tylko z jednej sieci neuronowej zamiast dwóch, pozwalając na efektywniejsze trenowanie (wcześniej stosowano sieć polityk do wyboru następnego ruchu i sieć wartości do przewidywania zwycięzcy po każdym ruchu). Wreszcie też nie prowadzi już szybkich losowych gier do przewidywania zwycięstwa przy danej pozycji, lecz szacuje pozycje za pomocą wysokiej jakości sieci neuronowej.

Pracujący dla Google’a naukowcy są przekonani, że to dopiero początek. Ich zdaniem podobne techniki mogą zostać zastosowane w innych ustrukturyzowanych zagadnieniach, takich jak fałdowanie białek, poszukiwanie nowych materiałów czy zmniejszenie zużycia energii, przynosząc przełomowe dla społeczeństwa wyniki.

Oczywiście z zagadnieniami nieustrukturyzowanymi jest znacznie gorzej. Samodoskonalenie sprawdza się w grze w go, jednak w grach z ukrytą lub ograniczoną informacją, takich jak StarCraft, trudno będzie tą metodą poradzić sobie z trudniejszymi wyzwaniami, przyznają badacze. To dla mięsnych inteligencji dobra wiadomość – jako że zaś świat jest znacznie bardziej podobny do StarCrafta, niż do go, póki co nie musimy się obawiać, że AlphaGo Zero z czasem stanie się superinteligencją na miarę Skynetu.

Słowo klucz to „póki co” – badacze z projektu OpenAI niedawno opublikowali wyniki grania samouczących się sztucznych inteligencji w popularną grę Dota 2. AI, które zaczęło naukę z początkiem marca, w sierpniu zdołało pokonać najlepszych ludzkich graczy, takich jak SumaiL.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.