Chińska sztuczna inteligencja powie twoim głosem to, czego sam byś nie powiedział

Chińska sztuczna inteligencja powie twoim głosem to, czego sam byś nie powiedział25.02.2018 10:50

Oprogramowanie pozwalające maszynom mówić naszym głosemrzeczy, których nigdy byśmy sami nie powiedzieli może pojawić sięwcześniej, niż będziemy na nie gotowi. Naśladownictwo ludzkiegogłosu od lat budzi wielkie zainteresowanie badaczy naturalnychinterfejsów użytkownika, jak do tej pory jednak uzyskanienaturalnego brzmienia było trudne, a idealne podszycie się podokreślony głos wręcz niemożliwe. Eksperci od sztucznejinteligencji z chińskiego potentata internetowego Baidu poczynilijednak wielki krok naprzód, tworząc system klonowanianeuronalnego, zdolny zachowaćakcent i wiele charakterystycznych cech mowy. Czy dzięki temurozwiązaniu uda się na dobre wprowadzić ludzkość w erępostprawdy?

Jak do tej pory nagrania głosowemogły być wykorzystane jako dowody w sądach. Oczywiściemontowanie z wycinków nagrań głosu człowieka czegoś nowego, cozawierałoby np. jakąś kompromitującą deklarację, nie jestniczym nowym, takie rzeczy robiło się już w latach 70 za ZimnejWojny. Bardzo trudno było jednak uzyskać wiarygodne brzmienie,metoda kopiuj i wklej pozwalała działać tylko na dostępnymzbiorze nagranych słów. Bazujące na sieciach neuronowych metodyopisane w artykule pt.Neural Voice Cloning with a Few Samplesto jednak zupełnie nowa jakość: na podstawie raptem kilku nagrańudaje się zbudować wiarygodnie brzmiący model mówcy, który powiewszystko, głosem bardzo podobnym do tego z nagrania.

Badacze eksperymentowali z dwiemametodami. Pierwsza z nich to adaptacja mówcy, polegająca natrenowaniu modelu sieci neuronowej na różnych mówcach o różnychgłosach. Wykorzystano w tym celu zbiór LibriSpeech, zawierającypróbki mowy niemal 2,5 tysiąca mówców. Z tego zbioru sieć uczysię wyróżniach cechy mowy, by na tej podstawie naśladowaćspecyfikę wymowy i rytmu mówienia.

Druga metoda, kodowanie mówcy,bazuje na trenowaniu modelu tak, by nauczył się określonych cechod mówiącego, odtarzając próbki dźwięku z oddzielnego systemuszkolonego na wielu mówcach. Tutaj po przeszkoleniu na zbiorzeLibriSpeech, wykorzystywane są dodatkowe próbki ze zbioru VCTK, podziesięć na mówcę. Zbiór ten to nagrania ponad setkianglojęzycznych mówców o różnych akcentach. Zadaniem siecineuronowej wyszkolonej na LibriSpeech jest ich jak najlepszeodtworzenie.

To drugie podejście wygląda naznacznie bardziej obiecujące, działa na dowolnych, wręcz losowychwypowiedziach i wymaga znacznie mniejszej mocy obliczeniowej ipamięci – eksperci Baidu mówią, że wystarczy do tegowspółczesny smartfon. Adaptacja mówcy wymaga tymczasem wygłaszaniaokreślonych zdań, wymaga też znacznie potężniejszego sprzętu.

Jak to działa w praktyce? Próbkimożecie wysłuchać na stronieinternetowej projektu. Z wypowiedzi „they had four childrentogether” powstało „churches should not encourage it or make itlook harmless”. Ze zdania „the regional newspapers hadoutperformed national titles” uzyskano „the large items have tobe put into containers for disposal”. Jak słychać, do ideałuwiele brakuje, poza tym próbki, które wytłuszczonym drukiemoznaczyli badacze wcale nie są naszym zdaniem tymi najlepszymi.Generowane nagrania są też wyraźnie niższej jakości niżoryginalne próbki. Niemniej jednak udaje się zachować akcent – igeneralne podobieństwo do mówcy.

Oczywiście chińscy badacze niemówią otwarcie o tworzeniu nowych wypowiedzi prezydenta DonaldaTrumpa, by skompromitować go na scenie międzynarodowej, ale obardziej przyziemnych i mniej złośliwych celach – ot np.skonfigurowanie inteligentnego audiobooka tak, by czytał dzieciombajkę głosem ich mamy. Przyznają jednak że konieczne będziewprowadzenie środków zapobiegawczych, by zapewnić, że technologiata nie zostanie wykorzystania w niewłaściwy sposób.

Pocieszająca bzdura w erzeotwartego oprogramowania i tanich, potężnych kart graficznych dotrenowania sieci neuronowych, a nawet testowanych usług w chmurze,takich jak projekt Lyrebird. Coprawda Adobe przeraziło się chyba konsekwencji prawnych swojegoProjektuVoCo i po tej demonstracji w 2016 roku na forum nowych pomysłówkonferencji MAX nic już więcej nie pokazało – ale jak widać, naAdobe świat się nie kończy.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.