r   e   k   l   a   m   a
r   e   k   l   a   m   a

Syntetyczna pornografia ze sztucznej inteligencji: nasze twarze już nie są nasze

Strona główna AktualnościOPROGRAMOWANIE

Przyjaciele i rodzina Gal Gadot, popularnej izraelskiej modelki mogli się w tym tygodniu poczuć… zniesmaczeni? Zaskoczeni? Przerażeni? Na pewno jednak widok bliskiej im kobiety, biorącej udział w pornograficznym filmiku z mężczyzną przedstawionym jako jej „brat przyrodni”, musiał nimi wstrząsnąć. Pewnie dopiero po bliższym przyjrzeniu się zauważyli, że to nie jej ciało, a z twarzą momentami bywa coś nie tak. Dżin jednak uciekł z butelki. Bliżej nieznany programista, korzystający na reddicie z nicka deepfakes, udowodnił, że niewielkim nakładem sił i środków można dziś z każdego zrobić gwiazdę sceny, w jakiej nigdy nie uczestniczył. Pożegnajcie się z „niezbitymi dowodami” z nagrań, czas przestać wierzyć we wszystko, co się widzi.

Deepfakes nie ma własnego studia efektów specjalnych. Nie korzysta z kosztującego dziesiątki tysięcy dolarów oprogramowania ani superkomputerów. Klip wideo z Gal Gadot, który przyniósł mu sławę w Internecie, zrobił za pomocą google’owego frameworka TensorFlow i przeznaczonej do szybkiego głębokiego uczenia sieci neuronowych biblioteki Keras. Te same narzędzia pozwoliły mu wcześniej stworzyć syntetyczną pornografię z udziałem takich celebrytek jak Scarlett Johansson, Maisie Williams, Aubrey Playa i Taylor Swift, publikowanych na subreddicie /r/celebrityfakes.

Za źródło obrazu posłużyły publicznie dostępne zasoby – wyniki wyszukiwania Google Image Search, stockowe zdjęcia i klipy z YouTube. Do tego oczywiście wzięty z pornograficznej witryny filmik, w którym grającej bohaterce sztuczna inteligencja zaraz miała podmienić twarz. Deepfakes wyjaśnia, że korzysta z algorytmu inspirowanego rozwiązaniami Nvidii, wykorzystywanymi do przekształcania atrybutów obrazu.

r   e   k   l   a   m   a

Podziw internautów wzbudził tego lata klip wideo, w którym zimowa sceneria widziana z okna samochodu zostaje przemieniona w scenerię letnią. Tu całą pracę wykonały rywalizujące ze sobią sieci neuronowe (GAN – generative adversial networks), które z wykorzystaniem wariacyjnych autokoderów (VAE – variational autoencoders) w procesie nienadzorowanego treningu opracowały sobie algorytm takiej transformacji. Jedna sieć generowała syntetyczne obrazy, próbując oszukać drugą sieć, która uczyła się jak odróżniać fałszywe obrazy od rzeczywistych. Z czasem osiągnęły w tym naprawdę niezły poziom.

Badacze Nvidii zapewne nie myśleli, że coś takiego mogłoby posłużyć do tworzenia syntetycznej pornografii, a jednak – na Pornhubie już niemal 200 tysięcy osób zobaczyło klip z Gal Gadot (którego z oczywistych powodów tu nie wstawiamy). Każdy kto go obejrzy przyzna, że choć nie jest doskonały, choć w wielu miejscach pojawiają się wizualne usterki, a ruch ust nie zawsze odpowiada wypowiadanym słowom, to jednak na pierwszy rzut oka iluzja jest niezła. Deepfakes wyjaśnia – znalazłem sprytny sposób na podmianę twarzy. Mając setki zdjęć, mogę łatwo wygenerować miliony zniekształconych obrazów, by trenować na nich sieć. Jak dostarczę sieci czyjąś inną twarz, uzna, że to kolejny zniekształcony obraz i będzie próbowała dostosować go do tego, co poznała na twarzy szkoleniowej.

Technika dopiero raczkuje, ale można się spodziewać, że w najbliższych latach tworzenie fałszywych filmów za pomocą głębokiego uczenia wejdzie na wyższy poziom, tym bardziej, że dostępna dziś za względnie nieduże pieniądze moc obliczeniowa jest oszałamiająca. Kilka dni temu Nvidia zaprezentowała przecież kartę Titan V w mikroarchitekturze Volta, której ponad 21 mld tranzystorów zapewnia wydajność 110 TFLOPS, a dzięki 640 specjalnym „rdzeniom tensorowym”, ma być dziewięciokrotnie wydajniejsza w głębokim uczeniu niż jej poprzednik. Co deepfakes będzie w stanie zrobić z taką kartą, zobaczymy pewnie na reddicie.

Yuanshun Yao z University of Chicago, prowadzący badania nad automatycznym tworzeniem przekonujących recenzji w Sieci za pomocą sztucznych sieci neuronowych, a także wykrywaniem takich fałszywych recenzji, przekonany jest, że za 5 do 10 lat będziemy otoczeni takimi tworzonymi przez AI treściami. Z kolei Hany Farid, ekspert z Dartmouth College prowadzący badania nad wykrywaniem fałszywych wideo, jest przekonany, że w bliskiej przyszłości możemy zobaczyć np. jak wygenerowany klip, na którym prezydent Trump wydaje rozkaz ataku nuklearnego na Koreę Północną dostaje się do Sieci i wywołuje panikę porównywalną z tą, jaką wywołała radiowa edycja „Wojny Światów” H.G. Wellsa.

Niektórzy już już rozpaczają nad etycznymi konsekwencjami postępu technicznego – i są wśród nich gwiazdy porno. W odniesieniu do produkcji deepfakes pojawiają się głosy o „uprzedmiotowieniu” kobiet, uczynieniu z nich obiektów, którymi można dowolnie manipulować i zmusić do dowolnych aktów – tak jakby samą esencją pornografii nie było wzięcie w nawias zakłócających erotyczną fantazję aspektów seksu. Inne gwiazdy mówią, że podstawą tworzenia pornograficznych produkcji jest przyzwolenie (consent), tymczasem tworzenie fałszywych scen z udziałem celebrytek odbiera im to prawo do przyzwolenia i jako takie jest złe.

Można jednak uznać, że faktycznie chodzi o coś innego. Dla ludzi zarabiających niezgorsze pieniądze swoim wizerunkiem, przejęcie tego wizerunku przez sztuczne inteligencje, tworzenie przez samodzielnych programistów–trenerów treści wychodzących naprzeciw fantazjom widzów to podważenie ich modelu biznesowego. Jeśli za 10 lat możliwe się stanie wygenerowanie dowolnej sceny pornograficznej (i nie tylko pornograficznej) z udziałem postaci wyglądających tak, jak sobie tego życzy projektant sceny, to kto będzie chciał płacić aktor(k)om kilka tysięcy dolarów za dzień zdjęciowy?

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.