r   e   k   l   a   m   a
r   e   k   l   a   m   a

Fotoszopowanie dla fake-świata: sieci neuronowe skończą historię?

Strona główna AktualnościOPROGRAMOWANIE

Walka internetowych tuzów z tzw. fake newsami przybiera na sile, wykorzystywane są w tym celu zarówno narzędzia algorytmiczne jak i zespoły mechanicznych Turków, tj. ludzkich moderatorów. Kilka dni temu mechanizm sprawdzania faktów ruszył we wszystkich wersjach językowych wyszukiwarki Google – w wynikach wyszukiwania przy niektórych artykułach pojawia się już informacja o wiarygodności artykułu. A gdy jedni pracują nad technologiami, które miałyby zapewnić jednomyślność co do tego, jak jest, inni robią coś znacznie ciekawszego. Na naszych oczach powstają technologie, za sprawą których uwiarygodnienie wydarzeń może stać się praktycznie niemożliwe.

Jak uwiarygodnić opowieść? Uważa się, że dobrym dowodem są zdjęcia i nagrania wideo, ewentualnie zeznania świadków. Dobre zdjęcie w oczach opinii publicznej może być nawet casus belli, powodem do wojny, jak to dopiero co mogliśmy zobaczyć po amerykańskim ataku rakietowym na syryjską bazę lotniczą al-Sharyat. Zdjęcie, albo się to nie wydarzyło, jak mówi internetowa doktryna. Jest zdjęcie, można wystrzelić 59 Tomahawków Block IV i patrzeć, jak cena akcji Raytheona rośnie.

Z drugiej strony rośnie podejrzliwość ludzi wobec zdjęć. Słowo „fotoszopować” trafiło nawet do Obserwatorium Językowego Uniwersytetu Warszawskiego, definiowane jako poprawianie lub zmienianie fotografii lub filmu w programie graficznym. Z „fotoszopowaniem” walczy się niekiedy niemal jak z fake newsami – ot np. we Francji i Norwegii narzucono regulacje zakazujące pokazywać zbyt dobrze (za sprawą fotoszopowania) wyglądające modelki, wg ustawodawców ranią one bowiem kobiety, tworząc nierealistyczne, idealne wizerunki.

r   e   k   l   a   m   a

Fotoszopowanie miałoby więc, przynajmniej na razie, tworzyć świat idealny. Jesteśmy więc przekonani, że jesteśmy w stanie odróżnić świat realny, z jego niedoskonałościami, od obrazu czy nagrania wyidealizowanego. I faktycznie, coś w tym jest, łatwiej stworzyć obraz doskonałej, gładkiej skóry bez skaz, niż obraz skóry nieidealnej, porośniętej włosami, z pryszczami. Łatwiej, ale czy jest to niemożliwe? Co zrobimy, gdy możliwości narzędzi informatycznych będą wystarczające, by fotoszopować realnie, niedoskonale, a nawet wytwarzać zupełnie nowe, realistyczne obrazy?

Kilka dni temu w amerykańskich mediach IT przypomniano o osiągnięciu badaczy z Adobe Systems i Cornell University. Wykorzystując sieci neuronowe i głębokie uczenie się, stworzyli oni narzędzie o nazwie Deep Photo Style Transfer, o którym pisała Xyrcon jeszcze w marcu. Przypomnę pokrótce – narzędzie to jest w stanie przekształcać obrazy wejściowe, do obrazu wynikowego wprowadzając charakterystyki obrazów referencyjnych. To znacznie więcej, niż tylko podmiana tła. Technika semantycznej segmentacji krawędzi, tekstur, treści i stylów pozwala tworzyć realistycznie wyglądające obrazy świata, którego nigdy nie było, bo nigdy nie było tego domu przy tej ulicy, nigdy nie sfotografowano tego auta nocą na tle drzew. Obraz jednak jest. Fake-news?

Nie jest to odosobniony przypadek. Wiele już możemy zrobić z ludzkimi twarzami. Rosyjska aplikacja FaceApp budzi zainteresowanie nie mniejsze niż słynna Prisma. I tu wykorzystano sieci neuronowe, które obraz na wejściu potrafią realistycznie przekształcić, tak by Władimir o poważnej minie stał się Władimirem z szerokim uśmiechem, a młody mężczyzna przemienił w starą kobietę… jednak o niepokojąco podobnych rysach twarzy. Może to zdjęcie matki? Nie, to tylko algorytm.

Te starania w tworzeniu zdjęć nieprawdziwych mogą tylko wzmocnić rozwiązania, których celem jest stworzenie nieprawdziwej mowy. W zeszłym roku Adobe na konferencji MAX pochwaliło się oprogramowaniem rozwijanym pod nazwą kodową VoCo, które po pozyskaniu 20-minutowej próbki mowy, są w stanie wygenerować całe słowa, a nawet zdania, wypowiedziane tym samym głosem co na nagraniu wejściowym. Dzięki VoCo każdy będzie mógł przyznać się do stawianych mu zarzutów pożerania niemowląt. Że nigdy nic takiego nie powiedział? Nie szkodzi, mamy na taśmie, że powiedział. Z charakterystyczną chrypką, drżącym głosem.

Nie dzisiaj, nie jutro, ale przypomnijcie sobie, gdzie sieci neuronowe były 10 lat temu, w roku 2007, przypomnijcie sobie te nowe google’owe czipy TPU do maszynowego uczenia – i pomyślcie sobie, jak bardzo każdemu poważnemu graczowi na arenie międzynarodowej muszą być potrzebne narzędzia, dzięki którym fotoszopowanie przyniesie realistyczne wyniki. Czy zbyt śmiała jest myśl, że w 2027 roku na wiarygodnych zdjęciach będzie można przedstawić każdy pomysł ich… projektanta?

Historycy przyszłych stuleci będą mieli niełatwe zadanie, by ustalić, jak to było w naszym coraz ciekawszym wieku XXI. I jak wyglądali ludzie w tych czasach, skoro jedyne co się zachowało to selfie przetworzone za pomocą Adobe Sensei.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.