Sztuczna inteligencja przeczyta audiobooki naturalną intonacją i głosem autora

Sztuczna inteligencja przeczyta audiobooki naturalną intonacją i głosem autora13.08.2019 21:31
Sogou stworzy kolejne głosowe awatary na potrzeby syntezatorów mowy. (fot. materiały prasowe Sogou)

E-booki, to po prostu zmiana formatu książki na elektroniczny głównie dla wygody. Ale głosowe audiobooki wiążą się też z nowym doświadczeniem - ludzkim głosem lektora czy aktorów. A gdyby tak nauczyć komputer mówić głosem autora książki? Nawet już zmarłego.

Wzrost popytu na książki w wersji audio widać chociażby w Chinach. BBC News powołując się na iiMedia prognozuje, że rynek audiobooków w kraju środka w latach od 2016 do 2020 ma wzrosnąć ponad dwukrotnie do 7,8 mld juanów (około 1,1 mld dolarów). Warto w takim razie inwestować w tą gałąź elektronicznych książek. Sztuczna inteligencja pomoże uzyskać na podstawie próbek głosu wiarygodne nagrania lektorskie. Dzięki temu będzie taniej, a także z nowymi możliwościami.

AI to sposób na tańszą produkcję audiobooków

Jeden ze start-upów z Wielkiej Brytanii uważa, że przetwarzanie mowy pozwoli na stworzenie typowego audiobooka w kilka godzin i przy 10% aktualnych kosztów. Oczywiście nie mówimy o mocno syntetycznym sposobie intonacji jak chociażby u asystentów głosowych, a prawdziwie profesjonalnych nagraniach, które miałyby być bardzo wierne pracy lektora lub aktora z krwi i kości. Nowe metody uzyskania mowy są coraz bardziej naturalne dla ludzkiego ucha.

Niektóre rozwiązania działają przy naprawdę niewielkich próbkach. Chociażby technologia Lyrebird umożliwia stworzenie wzorca mowy z minutowego nagrania audio, w którym czytamy podsuwane kwestie. Co prawda, słychać wtedy sztuczność, ale twórcy zalecają nagranie o wiele większego zestawu próbek, aby polepszyć efekt. Syntezator mowy Lyrebird działa tylko w języku angielskim, ale to technologia dostępna nawet dla przeciętnego użytkownika w domowym zaciszu, a założenie konta jest darmowe.

Znani twórcy jako głos z komputera

Wracając jednak do Chin, to tamtejsza wyszukiwarka Sogou chce stworzyć projekt opracowywania audiobooków przez syntezator mowy bazujący na sztucznej inteligencji. Byłyby to nie byle jakie głosy, a użyczone przez samych autorów. Naturalnie wystarczyłoby jedno podejście, więc pojedyncze dłuższe nagranie załatwiałoby sprawę całego dorobku audiobooków danego autora. Informacje te zostały ogłoszone na China Online Literature+.

Jak na razie mowa o cyfrowych głosach Yue Guan i Bu Xin Tian Shang Diao Xian Bing. To nie pierwszy tego typu projekt Sogu. Firma stworzyła już dwa awatary przedstawiające telewizyjne wiadomości, które są w użyciu przez rządową agencję informacyjną Xinhua.

Kto wie czy kiedyś nie dostaniemy innego typu projektów. Może za jakiś czas cyfrowo wskrzesimy głosy pisarzy lub innych sławnych osób, którzy nie nagrają już swoich kwestii, bo dawno od nas odeszli. Jeśli zebrać wszystkie nagrane z różnych źródeł ścieżki audio, to na pewno dysponujemy wystarczającą bazą dla często udzielających się przed kamerą i mikrofonem postaci.

Z czasem nawet krótkie przypadkowe próbki zapewne będą mogły wystarczyć. W takim razie jest szansa też dla ważnych postaci z naszego dorobku kultury, które nie były aż tak medialne lub po prostu zmarły na tyle dawno, że nie doczekały czasów, w których zapewne pozostawiłyby po sobie więcej nagrań głosu.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.