Potrzebne trzy sekundy. Potem stracisz głos

Potrzebne trzy sekundy. Potem stracisz głos10.01.2023 13:53
Trzy sekundy, po których stracisz głos
Źródło zdjęć: © Unsplash.com

Sztuczna inteligencja może osiągać niewiarygodne wyniki. Microsoft zaprezentował oprogramowanie VALL-E, które potrzebuje tylko trzech sekund, aby móc posługiwać się twoim głosem.

Sztuczna inteligencja w ostatnim czasie zawojowała internet. Udostępniane w sieci oprogramowanie pokazuje, jak duże są możliwości jej wykorzystania. SI potrafi tworzyć obrazy, które zachwycają, pisać poprawne gramatycznie teksty, a także, jak się okazuje, bardzo dokładnie kopiować ludzki głos.

VALL-E to sztuczna inteligencja, która potrafi symulować głos, bazując na jego trzysekundowej próbce. Wystarczy krótki urywek wypowiedzi, by oprogramowanie nauczyło się naśladować głos jej autora, uwzględniając przy tym intonację, czy emocje, które towarzyszyły osobie mówiącej. Możliwości VALL-E imponują, ale mogą nieść za sobą też poważne zagrożenie.

Dalsza część artykułu pod materiałem wideo

Czy warto kupić kamerę internetową Logitech Brio 500?

Z tego rodzaju sztucznej inteligencji z pewnością z chęcią skorzystałoby wiele osób. Łatwo sobie wyobrazić wykorzystanie jej w postaci lektora, który odczytuje instrukcję obsługi na życzenie klienta, czy przekazuje na bieżąco informacje na temat opóźnień pociągów na danej stacji. Z możliwości skorzystania z tego rodzaju programu z pewnością ucieszyliby się twórcy kreatywni.

Swego czasu w polskim internecie dostępne były programy, które potrafiły generować wypowiedzi na podstawie głosów bohaterów popularnych gier komputerowych. Było to narzędzie, które mogło mocno rozwijać fandom - twórcy fanowskich modyfikacji mogli przy poniesieni znikomych kosztów stworzyć pełne udźwiękowienie swoich produkcji. Nie brakowało też prób wykorzystywania możliwości oprogramowania do tworzenia humorystycznych filmów.

Tego rodzaju oprogramowanie wymagało jednak wgrania sporej liczby linii dialogowych, by nauczyć się odpowiednio interpretować dźwięki. W przypadku VALL-E sytuacja jest o wiele prostsza. Na stronie projektu można sprawdzić, jak dobrze program radzi sobie z generowaniem dźwięku na podstawie krótkiego urywku wypowiedzi. Choć dźwięk nie brzmi idealnie, jest bliski naturalnemu odwzorowaniu ludzkiej mowy.

Twórcy osiągnęli ten wynik przez długi trening sztucznej inteligencji. Jak czytamy w opisie oprogramowania - trenowano je na podstawie 60 tys. godziny angielskich wypowiedzi, co zdaniem autorów tego narzędzia oznacza setki razy większą bazę, niż w przypadku konkurencyjnych rozwiązań.

Zagrożenia związane ze sztuczną inteligencją

Trzeba jednak przyznać, że każdy medal ma dwie strony. O ile po jednej mamy możliwość szybkiego zastępowania lektorów w wielu sytuacjach, o tyle po drugiej istnieje obawa o nasze bezpieczeństwo. Wśród udostępnionych próbek można trafić na te, które pochodzą z rozmów telefonicznych. Oprogramowanie świetnie radzi sobie z symulacją głosu przechwyconego podczas rozmowy przez telefon.

Łatwo sobie wyobrazić, że osoby o nieuczciwych zamiarach będą chcieli wykorzystać tego rodzaju oprogramowanie i, przechwytując głos swoich potencjalnych ofiar, wykorzystywać go do nieetycznych praktyk. Oszustwa "na wnuczka" i pokrewne mogą być jeszcze łatwiejsze, jeśli oszust będzie mógł posługiwać się głosem rzeczonego wnuka.

Możliwe, że tego typu oprogramowanie zostanie też wykorzystane do tzw. robocalls. W Polsce praktyki te znamy przede wszystkim z telefonów dotyczących instalacji fotowoltaicznych. Obecnie rozmówca może usłyszeć podczas takiej rozmowy jedną z wielu nagranych wcześniej kwestii, które rzecz jasna brzmią naturalnie, ale nie zawsze pasują do kontekstu całej rozmowy.

Wykorzystanie sztucznej inteligencji może zmienić sytuację. Być może w przypadku prostego oprogramowania dałoby się usłyszeć nieidealne akcentowanie, czy dość "płaskie" brzmienie samej wypowiedzi. Jednak możliwość dopasowywania jej dokładnie do trwającej rozmowy, wraz z wykorzystywaniem imienia rozmówcy, może dodać wiarygodności dzwoniącym.

Sztuczna inteligencja to potężne narzędzie. Jak każde może zostać wykorzystana w dobrych lub złych intencjach. Jej powszechne wykorzystanie to kolejny krok w kierunku rozwoju społeczeństwa. Ważne jest, aby uświadomić sobie, jakie zagrożenia za sobą niesie i co należy robić, by uniknąć kłopotów z nią związanych, jednocześnie nie demonizując jej.

Karol Kołtowski, dziennikarz dobreprogramy.pl

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.