Strona używa cookies (ciasteczek). Dowiedz się więcej o celu ich używania i zmianach ustawień. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.    X

Śpiewać każdy może - nawet komputer! (Vocaloid, cz. 1)

Zainspirowany ledwie muśnięciem tematu przez użytkownika techmagia postanowiłem popełnić niniejszy (i następny) wpis, dokładnie poruszający kwestię syntezatora śpiewu Vocaloid. Mam nadzieję, że uda mi się rozwinąć ten temat wystarczająco, aby zadowolić zarówno siebie, jak i wszystkich zainteresowanych tą technologią :)

Lekcja śpiewu dla komputera

Wydanie pierwsze

Historia Vocaloidów (ang. "Vocal Android" - "Śpiewający Android"; w dalszej części artykułu wyjaśni się liczba mnoga :) ) sięga 2000 roku, kiedy to pracujący na Pompeu Fabra Universitat w Hiszpanii Kenmochi Hideki utworzył jeden z głównych modułów systemu odpowiadający za przetwarzanie syngałów (signal processing). Pierwotnie, projekt ten miał charakter otwarty, jednak jego możliwości zwróciły uwagę firmy Yamaha, producenta znanego u nas głównie z rynku motocykli, czy "śmiesznych japońskich robotów", a zarazem podbijającego świat czołowej klasy sprzetem muzycznym. Yamaha bez wahania wykupiła całość projektu, czyniąc Hideki'ego (teraz dobrze użyłem apostrofu? :P) ojcem Vocaloidów. 4 lata później, po pokazie możliwości w 2003 roku, wydana została pierwsza generacja silnika Vocaloid.

Meiko - Noise; Vocaloid 1

Oczywiście silnik byłby bezużyteczny bez bazy danych o "wokaliście". Tu z pomocą przyszła firma Zero-G, która wraz z Vocaloid 1.0 udostępniła dwa głosy anglojęzyczne - męskiego Leona, oraz żeńską Lolę. Po kilku wygranych nagrodach muzycznych, pojawił się nowy głos żeński: Miriam. To, czym się ona wyróżniała, to fakt, że jako pierwsza posiadała "dawcę" głosu. Była to Miriam Stockley, wokalistka z Wielkiej Brytanii. Do tego momentu, popularność Vocaloid'a powoli wzrastała w stałym tempie.

Megurine Luka - Dancer in the Dark (wersja angielska); Vocaloid 2

Yamaha, zachęcona sukcesami swojego silnika, postanowiła wprowadzić Vocaloid na swój rodzimy rynek - do Japonii. Zlecenie otrzymała firma Crypton Future Media, która wywiązała się ze swojego zadania bardzo dobrze, tworząc w odstępie dwóch lat dwa nowe głosy japońskie. Pierwsza była Meiko (jej możliwości prezentuje filmik zamieszczony wyżej), wzorowana na Meiko Haigou (tu uwaga do redakcji - nie obsługujecie zagranicznych znaków diaryktycznych, nie można użyć znaków z "macronem", gdyż są podmieniane na zwykłą literę. Do czytelników: takie literki oznaczam w zgodzie z notacją dodatkową, niemą literą "u", wydłużającą samogłoskę), profesjonalnej wokalistce japońskiej, drugi był Kaito, wzorowany na Naoto Fuuga, również profesjonalnym wokaliście z Japonii. Jako ciekawostkę podam tylko, że Naoto Fuuga to nie nazwisko i imię (Japończycy przedstawiają się "od tyłu"), lecz pseudonim. Wokalista ten nie udostępnia ani swojej prawdziwej daty urodzenia, ani prawdziwego nazwiska. Samo Naoto Fuga, tudzież "fuuga na oto" w bezpośrednim przełożeniu oznacza "szykowny dźwięk" (ang. "tasteful sound").

Wydanie drugie

Do 2007 roku Yamaha nauczyła się nieco na swoich błędach, które popełniła w pierwszej wersji. Jednym z nich był fakt, że pomimo angielskiego interfejsu oprogramowania, zastosowana fonetyka - zarówno dla vocaloidów angielskich, jak i japońskich - była w 100% japońska. Poza tym, firma widziała znacznie większy odzew ze strony swoich rodzimych odbiorców, niźli od użytkowników zagranicznych. To zaważyło na rozwoju silnika Vocaloid 2, najpopularniejszego syntezatora śpiewu na świecie, aż po dzień dzisiejszy.

Jedna z najpopularniejszych piosenek Hatsune Miku; Vocaloid 2

Wraz z nim wszedł ogrom nowości, jak dodanie sampla udającego oddychanie wokalisty, czy system zarządzania emocjami w trakcie śpiewu. Trzeba przyznać - był to kawał dobrej roboty.

Vocaloid 2 doczekał się aż 17 oficjalnych Vocaloidów, z czego 5 przeznaczonych było do wersji angielskiej oprogramowania, zaś pozostałych 12 jedynie do wersji japońskiej. Każdy z nich posiada od jednej do kilku niezależnych od siebie bibliotek dźwięku, zwanych też presetami. Warto dodać, że Megurine Luka, jedna z najpopularniejszych Vocaloidek, pomimo przeznaczenia na rynek japoński i posiadania w metryce narodowości japońskiej, jako jedyna posiada dodatkowe biblioteki anglojęzyczne, co czyni z niej najbardziej uniwersalnego Vocaloida. Z drugiej strony, nawet bez takowych, fanom udało się "zmusić" do śpiewania po angielski także inne Vocaloidy ;)

Głównym dostawcą Vocaloidów dla tej edycji silnika znowu była firma Crypton Future Media. To ona odpowiada za pierwszy japoński głos tego syntezatora, Hatsune Miku, która pobiła wszelkie rekordy popularności. Dość powiedzieć, że mój kolega zdążył się zakochać w jej głosie, po czym nagle się ocknął, że ona nie istnieje :) Jego historia nie jest zresztą odosobniona.

Piosenka Hatsune Miku wykorzystująca niemal pełną skalę jej głosu - właśnie ona zmyliła mojego koledę; Vocaloid 2

Teoretycznie mógłbym Wam opisać każdego z Vocaloidów dla wersji drugiej, jednak skupię się tylko na trzech (lub - gwoli ścisłości - czterech). Zwą się: Hatsune Miku, Kagamine Rin i Len oraz Megurine Luka. Dlaczego na nich? Były to pierwsze Vocaloidy "powołane do życia" w serii "Character Vocal Series", posiadające własny avatar (wzorowany na postaciach mangowych), metryczkę i historię. Jednak to dopiero w następnym "odcinku". Teraz przeskoczę szybko przez temat najnowszego wydania silnika Vocaloid, i na dziś kończymy ;)

Wydanie trzecie

Na rynku pojawiło się w październiku zeszłego (2011) roku. Ze względu na gigantyczną popularność swojego poprzednika, wiele firm wszczęło prace nad pluginami, zapewniającymi zgodność wsteczną z dotychczasowymi Vocaloidami i ich bibliotekami dźwięków. Jedną z największych nowości jest moduł "Vocalistener", czyli po naszemu mniej więcej "Wokalosłuch". Jego zadaniem jest iteracyjne dostosowywanie zaprogramowanej ścieżki do głosu nagrywanego standardowo przez użytkownika, co ma zapewnić jeszcze bardziej realne brzmienie generowanego głosu. Jeśli natomiast użytkownik nie czuje się mocno w śpiewie, lub chce zapewnić swojemu utworowi bardziej nieprawdopodobne brzmienie, może przełączyć aplikację do trybu "klasycznego", który zapewnia bardziej "komputerowy" efekt. Vocaloid 3 odróżnia jeszcze jedna kwestia od poprzedników. Wspiera kolejne dwa języki, poza angielskim i japońskim - chiński i koreański.

Oficjalne demo Lily - Vocaloida trzeciej generacji. W mojej opinii, Miku umie lepiej :P

Nowy jest także system dystrybucji. Do tej pory, silnik i głosy były ze sobą bardzo silnie związane - każdy Vocaloid składał się z silnika i biblioteki dźwięku. Trzecia generacja wprowadza niezależną sprzedaż pełnego silnika, od Vocaloidów (bibliotek) z jedynie jego silnie okrojoną wersją. Działanie takie Yamaha motywuje wygodą użytkowników, oraz ułatwieniem licencjonowania dla wielu celów. Dla przykładu, silnik Vocaloid 3, ma odnaleźć zastosowanie w branży gier komputerowych.

Jako bonus - mały szok (przynajmniej dla niektórych)

Wydawałoby się, że mało kto poza fanami nie miał styczności z Vocaloidami, w tym Hatsune Miku. Nic bardziej mylnego - miał z nią kontakt niemal każdy z nas, a to za sprawą pewnego internetowego mema. O czym mowa? Poniżej (przetłumaczony przeze mnie) fragment historii Nyan Cat'a, zaczerpnięty z anglojęzycznej Wikipedii:
Oryginalna wersja piosenki "Nyanyanyanyanyanyanya!" została udostępniona przez użytkownika "daniwell" na japońskiej stronie do streamingu wideo Nico Nico Douga 25. lipca 2010 roku. W piosence występuje Vocaloid Hatsune Miku. Japońskie słowo wykorzystywane jako onomatopeja dla kotów to nya, co jest ekwiwalentem angielskiego "meow".
Użytkownik "Momo Momo" udostępnił zremiksowaną wersję piosenki "Nyanyanyanyanyanyanya!", dodawszy wcześniej powtarzający się dźwięk "nyan" w całym utworze, także na Nico Nico Douga, 31. stycznia 2011 roku. Dodany głos pochodził z syntezatora śpiewu UTAU [jap. śpiewać - przyp. NRN] z presetem głosu "Momone Momo". Głos ten bazuje na głosie Fujimoto Momoko, mieszkańce Tokyo.
(...)
Użytkowniczka YouTube "saraj00n" (której prawdziwe imię to Sara) połączyła animację kota z wersją Momo Momo piosenki "Nyanyanyanyanyanyanya!", po czym udostępniła to za pośrednictwem Youtube 5. kwietnia 2011 roku, trzy dni po pojawieniu się w sieci wykorzystanej animacji Torresa, nadając całości nazwę "Nyan Cat".

Nie zgadniecie... NYAN CAT! (oryginalna piosenka dostępna jest po bezpłatnej rejestracji na Nico Nico Douga)

Pomyślelibyście, że Nyan Cat ma tak silne powiązania z Japonią, a wykorzystany utwór nigdy by nie powstał, gdyby nie pierwowzór "wyśpiewany" przez Miku? :) I nagle do nas dociera, jaki ten świat mały :D

A na deser...

...filmik z walki na miecze świetlne między Hatsune Miku, a personifikacją... nudy (związane jest to z historią Miku - więcej może opiszę w części drugiej) - Neru Akita, oraz [SPOILER] zaskakującym zakończeniem z innym fanowskim alter-ego Miku (wykorzystywanym jako avatar dla utworów, gdzie głos Miku brzmi fatalnie) - Haku Yowane. [/SPOILER] Animację wykonano m.in. z użyciem oprogramowania Miku Miku Dance, bazując na walce Ryan vs. Dorkman z serii krótkometrażowych filmów fanów Star Wars.

W następnym odcinku...

  • Przyjrzymy się postaciom z serii "Character Vocal Series"
  • Dowiemy się nieco o koncertach Vocaloid'ów w Japonii
  • Poznamy dobre źródła wiedzy na ten temat

Artykuły z serii Vocaloid:

 

oprogramowanie internet hobby

Komentarze

0 nowych
MaXDemage   18 #1 24.08.2012 10:30

Moje ulubione powiązanie z Vocaloidami to jednak Black Rock Shooter, która ponownie, gdyby nie syntezator nie stała by się tak sławna i tak cudowna ;D
Kawał dobrej roboty NRN ;D czekam na część drugą.

TomisH WSPÓŁPRACOWNIK  13 #2 24.08.2012 11:13

Taka uwaga - pakujemy ' tylko między samogłoskę, a samogłoskę. Czyli Vocaloidów, a nie Vocaloid'ów :)

Frankfurterium   10 #3 24.08.2012 12:13

@TomisH
Żeby było nieco bardziej precyzyjnie - odmianę przez apostrof stosujemy, kiedy słowo kończy się głoską niemą (niewymawianą). W dziwnych krajach zdarzają się dziwne imiona/nazwiska kończące się niemymi spółgłoskami ;-)
GrammarNazi-mode over and out ;-)

W_tym_temaciE   5 #4 24.08.2012 12:16

Japończycy zawsze byli dziwni O.o
Ale najdziwniejsze w nich jest to, że to co o nich większość myśli i uważa za dziwne, jest nieprawdą... prawda o nich jest jeszcze dziwniejsza ^^
BTW, koncerty Vocaloidów, to dopiero masakra jest.
Ja jeszcze rozumiem, słuchać takiej muzyki, ale jarać się holografami?

  #5 24.08.2012 13:22

Koncerty sa fajne. Widzialem wszystkie. A technologia w nich wykorzystywana jest o lata swietne przed amerykanami.

W_tym_temaciE   5 #6 24.08.2012 15:28

@macgvyer2004 (niezalogowany)
No i?
To nawet prawdziwa muzyka nie jest, akurat w kwestii muzyki, to Japończycy i Koreańczycy, produkują typowy mainstream, litości!
Gdyby było inaczej, Koreańskie, oraz Japońskie gwiazdy, by nie dostawały bycia w związku do np. 30 roku życia w umowie.

NRN   9 #7 24.08.2012 16:30

@TomisH & Frankfurterium, dzięki. Zawsze mnie to dezorientowało, poprawię to przy okazji korekty linków ;)

@W_tym_temaciE, już kiedyś gdzieś się wypowiadałem o mentalności Japończyków. Człowiek "zamknięty" za nic ich nie zrozumie. To tak jak z ludźmi ze średniowiecza - mieli kompletnie inną mentalność i trzeba się w znacznym stopniu "przestawić", żeby zrozumieć np. jak można było postawić przed sądem świnię, która okaleczyła niemowlaka, i jeszcze ją przesłuchiwać (więcej informacji: Jędrek, za czasów jak był jeszcze Kapitanem, nie Kasztelanem Zamku Chojnic). Japończycy jak mają problem, nie narzekają, a pracują. Jak chcą się pośmiać, to się nie hamują, tylko robią rzeczy zarówno zabawne, jak i żałosne do tego stopnia, że aż śmieszne. Mają do siebie ogromny dystans, i to mimo, że jako jednostki, bywają dość wstydliwi.

Wspomnę o tym może w części drugiej ;)

Verard   3 #8 24.08.2012 16:42

Miku Hatsune! 3< \o/ Polecam 13 memory (jakoś tak), Triple Baka, Love is War i black rock shooter :D

NRN   9 #9 24.08.2012 20:21

Artykuł zaktualizowany :)

W_tym_temaciE   5 #10 25.08.2012 10:50

@NRN
Aj tam, głupie rzeczy - mi chodzi np. o to, że prawo japońskie kara bycie... grubym (są wizytu u lekarzy - jesteś za gruby, masz parę miesięcy, żeby schudnąć - jak nie schudniesz do następnej wizyty, wysyłają Cię na leczenie - jak nie będziesz chciał współpracować, to płacisz kary pieniężne, można nawet dostać ~10mln USD - w wielkiej kumulacji, jak to się będzie długo ciągnęło.
Oraz, o np. takie fetysze, jak... automaty z brudną bielizną nastolatek.
[Tak, dobrze przeczytaliście - to bardo popularne w całej Japonii]
[A źródło to bodajże Tatami kontra krzesła]

NRN   9 #11 25.08.2012 17:20

@W_tym_temaciE, haha, mówisz o japońskich fetyszach... Oni się po prostu z tym nie kryją, dla nich to nic wstydliwego. Co innego tacy amerykańce - ci to dopiero są powaleni, ale wszystko to jest tam tajemnicą poliszynela :P

Tak więc cóż... Twoim zdaniem nieskrywane fetysze oznaczają "dziwactwo". W mojej opinii jest to bardzo inteligentne "zagranie", o czym świadczą efekty jego zastosowania. "Dziwactwem" natomiast jest to co się dzieje w Polsce i krajach zachodnich, gdzie robienie z tego swego rodzaju "tabu" powoduje spore problemy. Zresztą, proszę, oto statystyki przestępstw na tle seksualnym w Polsce i Japonii, gdzie na współczynnik Japoński bardzo silnie wpływa bardzo dobra dostępność szerokiego asortymentu artykułów z branży pornograficznej.

- Polska (fetysze - jeśli są - to są skrywane) - za: http://e-prawnik.pl/wiadomosci/informacje/gwalt-bez-przedawnienia-chca-zmian-do-... , http://en.wikipedia.org/wiki/Rape_statistics :
"Statystyki dotyczące przestępstw seksualnych nie przedstawiają się w Polsce najlepiej - aż co 2 do 5 sekund wykorzystywane jest seksualnie jedno dziecko."
Według artykułu, z którego pochodzi powyższy cytat, 0,08% polaków padło ofiarą przestępstwa na tle seksualnym w ciągu 3 lat, co daje ok. 0,026% rocznie. Dane te są jednak w mojej opinii dość ciężkie do porównania, gdyż pochodzą z innego źródła niż te, które posiadam o Japonii. Z tego względu, postanowiłem skorzystać z danych bardziej jednolitych.

Z pomocą przyszła mi Wikipedia. Biorąc pod uwagę tamtejsze dane (ponoć również policyjne): w 2010 roku 0,041% Polaków (ok. 15 tysięcy) było ofiarą gwałtu.

- Japonia (fetysze nieskrywane) - za: http://en.wikipedia.org/wiki/Rape_statistics
Tamtejszy współczynnik gwałtów i innych przestępstw na tle seksualnym, osiągnął w 2010 roku poziom 0,001%. Niższy jest tylko w Albanii (0,0007%), Azerbejdżanie (0,0002%) i Lichtenstein'ie (0%).

Badania naukowe prowadzone w tej sprawie wyjawiły, że spory wpływ na niskie współczynniki przestępstw tego rodzaju ma... fakt szerokiej dostępności artykułów pornograficznych i im podobnych. Mimo obaw, że (częściowe) umożliwienie dostępu osobom nieletnim do pornografii może spowodować ich spaczenie, testy (a ostatecznie praktyka) wykazały, że było zgoła odwrotnie. Ogólnie, specjalnie dla Ciebie zabrałem się za czytanie pewnego artykuły, i choć nie przebiłem się jeszcze w pełni przez niego, sądzę, że warto go przejrzeć, aby mieć lepsze spojrzenie na wpływy takich działań i takiego podejścia: http://www2.hu-berlin.de/sexology/BIB/DIAM/japan.htm

Tak na marginesie dodam, że młodzi Japończycy (w szczególności Japonki) są tak wyuczeni (wyuczone), że umieją włączyć podręczny alarm, zacząć uciekać i wezwać policję w sytuacji, gdy nieznajomy zatrzyma ich (je) w drodze do szkoły i spyta o godzinę, "bo zapomniał zegarka". Tak na wszelki wypadek. :P

W_tym_temaciE   5 #12 25.08.2012 21:14

"Tak na marginesie dodam, że młodzi Japończycy (w szczególności Japonki) są tak wyuczeni (wyuczone), że umieją włączyć podręczny alarm, zacząć uciekać i wezwać policję"
Tu się nie zgodzę.
Japonki, najczęściej nie wiedzą, co powiedzieć, co zrobić, kiedy ktoś je zacznie obmacywać w pociągu...
"Ogólnie, specjalnie dla Ciebie zabrałem się za czytanie pewnego artykułu"
Widzisz, to nie książki, to ja rozwijam :P

NRN   9 #13 25.08.2012 21:49

@W_tym_temaciE, "Widzisz, to nie książki, to ja rozwijam :P" Ha-ha-ha... nieśmieszne.

"Japonki, najczęściej nie wiedzą, co powiedzieć, co zrobić, kiedy ktoś je zacznie obmacywać w pociągu..."
To stwierdzenie akurat jest zabawne ^^ Ktoś tu się naoglądał Anime, tudzież japońskiej pornografii :D

W_tym_temaciE   5 #14 26.08.2012 12:08

Nie oglądam anime*, a tym bardziej japońskiej pornografii.
Obejrzałem, dwa, z ciekawości "co to jest?"

NRN   9 #15 26.08.2012 15:11

Skoro o Japonkach mowa - wiedziałeś, że w godzinach szczytu, na głównych liniach komunikacyjnych, na 7 wagonowy pociąg przypadają 2 wagony tylko dla kobiet, gdzie przebywanie mężczyzn karane jest mandatem?

W_tym_temaciE   5 #16 26.08.2012 17:41

Wiedziałem, a wiedziałeś, że ludzie po mieście nie poruszają się w wagonach?

NRN   9 #17 26.08.2012 18:15

@W_tym_temaciE, za ten suchar dam Ci puchar.

  #18 27.08.2012 07:09

Szukacie w Japonii Vocaloidów, a tymczasem Mike Oldfield na płycie "Light&Shade" też wykorzystywał syntetycznych "śpiewaków". Na przykład http://www.youtube.com/watch?v=zISdlxuT3o4 gdzie "głos" miał przypominać wokal Jon'a Andersona.

NRN   9 #19 27.08.2012 10:44

@D... Bramkarz - pomijając, że Mike Oldfield nagrał ten utwór będąc urzeczonym właśnie Vocaloidami (od nich się zaczęło), to do tej piosenki użyto m.in. odpowiednio spresetowanego głosu Miriam (Vocaloid 1; dane za: http://en.wikipedia.org/wiki/Light_%2B_Shade ). Warto chyba przypomnieć, że Miriam należała do grupy pierwszych trzech anglojęzycznych Vocaloidów, przy czym ten konkretny głos był bazował na Miriam Stockley. Co więcej, album Light & Shade powstał z przeznaczeniem na rynek hiszpański, skąd wywodzą się Vocaloidy :D

Zastanawiam się tylko, skąd wziąłeś tę informację: ' "głos" miał przypominać wokal Jon'a Andersona. ' Mam wrażenie, że nie doczytałeś opisów - to w piosence pt. Shine występował Jon Anderson :P Za: http://en.wikipedia.org/wiki/Shine_(Mike_Oldfield_song)

  #20 27.08.2012 20:04

@NDN. Jako wieloletni fan muzyki Michała Staropolskiego wiem to i owo. :)
Jon Anderson udzielał się nie tylko w singlowym "Shine", ale też mało docenianym "In High Places" z LP "Crises". Niestety Jon Anderson ma dość wysoki i nieco "piskliwy" głos, i nie dziwię się, że tak mało jest ich wspólnych produkcji.
Osobiście uważam, że tak naprawdę to Michał miał tylko dwóch wokalistów, którzy w 100% pasowali do jego popowo-rockowej części twórczości: Maggie Reilly - głos liryczny, ale potrafiący też "przyłożyć", jak na przykład w "Family Man"; oraz Barry Palmer - rockowy, ale wygładzony i nie osiągający wysokich rejestrów, np. w "Poison Arrows" gdzie trzeba było się ratować efektem typu chorus.