Sztuczna Inteligencja opanowała współpracę. Wygrywa z ludźmi w Dota 2

Sztuczna Inteligencja opanowała współpracę. Wygrywa z ludźmi w Dota 229.06.2018 12:49

Testowanie programów komputerowych w grach przeciwko człowiekowi ma długą tradycję. Przez dziesięciolecia były to szachy, potem program AlphaGo pokonał człowieka w Go. Obecnie SI jest wystawiana przeciwko ludziom w grach strategicznych, gdzie odniosła wart odnotowania sukces. Program w pewnych warunkach wygrywa z graczami w Dota 2. Warto zaznaczyć, że poprzeczka nie stała wysoko – SI nie starła się jeszcze z profesjonalnymi graczami.

W Dota 2 zagrały boty sterowane przez OpenAI Five – SI ogólnego zastosowania, rozwijaną przez organizację OpenAI, współfinansowaną przez Elona Muska. Celem jej istnienia jest edukacja i podnoszenie świadomości społeczeństwa na temat sztucznej inteligencji i jej obecnego stanu. W tym zawiera się przekonanie nas, że sztuczne sieci neuronowe są zupełnie bezpieczne i mogą przynieść nam ogromne korzyści w przyszłości.

Należy tu wyjaśnić, że gra w Dota 2 jest problemem innego typu niż szachy czy go. Gry te odbywają się w turach, podczas których SI ma sporo czasu na wypracowanie kolejnego ruchu, co nawet AlphaGo zajmowało kilka minut. Dota 2 zaś wymaga podejmowania decyzji w czasie rzeczywistym i jednoczesnego monitorowania stanu gry. Gra jest rozgrywana w 30 klatkach na sekundę, a jedna partia trwa niecałą godzinę (średnio 45 minut). Daje to 80 tysięcy ramek, z czego SI analizuje co czwartą. Proces ten jest bardzo wymagający obliczeniowo i gdyby nie możliwości przetwarzania w chmurze, w ogóle nie byłoby możliwości postawienia SI przeciwko ludziom w takiej grze. OpenAI Five to 5 osobnych modeli, działających na 124 tysiącach rdzeni CPU i 256 GPU w Google Cloud.

Sztuczne sieci neuronowe współpracują tak samo, jak 5-osobowe zespoły graczy z krwi i kości. Każda z nich zbudowana jest z jednej warstwy 1024 jednostek LSTM (Long Short Term Memory, zaprojektowane, by radzić sobie z zależnością od danych przechowywanych długoterminowo), obserwującej stan gry przez Bot API, dostarczone przez Valve. Wybrane akcje są wysyłane przez kilka wyjść, mających znaczenie semantyczne. Dzięki temu OpenAI Five może opóźnić polecenie i określić jego współrzędne.

reprezentacja ludzi, złożona z pracowników OpenAI, grających w Dota2 amatorsko
reprezentacja ludzi, złożona z pracowników OpenAI, grających w Dota2 amatorsko

OpenAI wcześniej trenowała sama ze sobą. W sumie boty rozgrywały codziennie mecze, które ludziom zajęłyby 180 lat – sporo więcej, niż byłby w stanie przyjąć trenujący zawodnik. Mimo tego program wciąż ma problemy z wieloma aspektami gry i wygrywa tylko w określonych warunkach. SI bardzo długo uczyła się wychodzić ze stref odłamków, choć jeszcze nie potrafi w ogóle w nie nie wchodzić. Nie radzi sobie jeszcze z niektórymi postaciami, przedmiotami i strategiami. Ten przykład pokazuje jednak, że bez wprowadzania danych generowanych przez ludzi SI może osiągnąć wysoki poziom umiejętności planowania z użyciem stosowanych aktualnie metod, choć wcześniej przypuszczano, że potrzebne będzie uczenie hierarchiczne przez wzmacnianie. Najwyraźniej autorzy eksperymentu nie docenili swojego modelu. Potrzebna moc obliczeniowa jest oczywiście ogromna, ale nie niemożliwa do uzyskania.

W przeciwieństwie do rozgrywek turowych gry jak StarCraft czy Dota 2 przypominają rzeczywistość. SI musi więc opanować planowanie długoterminowe na dużo większą skalę niż w przypadku szachów. Mówimy tu o 10 tysiącach ruchów w Dota 2 przeciwko mniej niż 40 w szachach i mniej niż 150 ruchach w Go. Ponadto model gry jest tworzony na podstawie obserwacji jedynie części planszy widocznej wokół bohatera, więc SI musi operować na niekompletnych informacjach i ruchach przeciwnika. Sama mapa także jest o dwa rzędy wielkości większa niż w klasycznych grach strategicznych. Przytłaczająca jest także liczba akcji, które może wykonać każdy bohater. Łącznie z ruchami i zaklęciami prowadzący eksperyment oszacowali, że na każdą z postaci przypada 170 tysięcy akcji, przy czym w danym cykli (czas dla SI został podzielony dyskretnie) można wykonać około tysiąca. W szachach będzie to średnio 35 akcji, w Go 250. Nie pomaga też ciągły rozwój gry Dota 2, która z każdą aktualizacją dostaje drobne zmiany parametrów.

#AI bots just beat humans at the video game Dota 2. That’s a big deal, because their victory required teamwork and collaboration – a huge milestone in advancing artificial intelligence. https://t.co/UqIUhh9xFc

— Bill Gates (@BillGates) 26 czerwca 2018Gracze też mogą się czegoś nauczyć od SI. Jednostki OpenAI Five doskonale ze sobą współpracują, realizując ogólną strategię. To właśnie umiejętność współpracy zadziwia najbardziej. SI bardzo dobrze radzi sobie z osaczaniem postaci z drużyny przeciwnej i relatywnie szybko wpadła na to, że może poświęcić swoją część mapy, by zająć safe lane przeciwnika i przenieść potyczkę na drugą stronę planszy. SI ma też tendencję do inwestowania w postacie wspierające wcześniej, niż żywi gracze, dzięki czemu szybciej osiąga szczytowe możliwości.

Mimo pewnych problemów i ciągłej walki z błędami OpenAI Five wystartuje w Mistrzostwach Świata Dota 2 w sierpniu. Pula nagród wynosi 40 milionów dolarów i jest to najlepiej opłacany turniej e-sportowy. W przyszłym miesiącu na Twitchu będzie można obejrzeć transmisję meczu przeciwko profesjonalnym graczom.

Źródło artykułu:www.dobreprogramy.pl
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.