Algorytmy na potrzeby muzyki z Atmos i kody technoszowinizmu

"Nigdy jeszcze w dziejach algorytmów komputerowych tak ważny nie był człowiek – przekonują dwie kobiety i ich głośne książki". Taki podtytuł dał Karol Jałochowski dla swojego artykułu w Polityce. W niniejszym wortalu zamieszczona została także informacja Piotra Urbaniaka o komercyjnym komputerze kwantowym IBM. Te dwa teksty wskazują, że dobrze jest widzieć nowe rozwiązania, jako na elementy procesu, a nie ofertę producenta. Optymalne dostosowanie nowych możliwości technicznych dla potrzeb odbiorców zapewnia jedynie różnorodność ofert.

Tekst w Polityce ma tytuł "Kody technoszowinizmu" i rozpoczyna się: Weźmy szpadel. W jego formie zawiera się cała historia ludzkiej kultury technicznej. Ileż musiało być szpadli dysfunkcyjnych, zanim ludzkość osiągnęła ten optymalny, jak się wydaje, kształt. Wiemy jednak, że szpadle nadal mogą być różne, chociaż jest to tak proste narzędzie. Natomiast w informacji opublikowanej w wortalu można przeczytać: "Od pewnego czasu trwają jednak spory dotyczące tego, czy sprzęt D-Wave Systems naprawdę można zaliczyć do grona komputerów kwantowych".

W pierwszym cytacie widać, że rozwój jest procesem, a w drugim, że są próby, by go zaszufladkować. Jaki sens ma szufladkowanie procesu, który nadal trwa, a wręcz zaczyna dopiero raczkować? Widać tu bez trudu manipulację, by stworzyć podstawy dla zysków, na które zapracować mogą inni. Szufladkowania ma sens, gdy coś się już nie zmienia i było w odległym czasie.

Z czasem dla osiągnięć techniki powstaje właściwy dystans. Uznajemy na przykład, że pierwszy opublikowany algorytm napisała dla maszyny parowej córka poety. Nikt przez to nie próbuje skojarzyć maszyn parowych z komputerami. Niemniej nazwa komputer nie powstała dla maszyn, a dla kobiet przetwarzających dane. Nie można przez to teraz wykluczyć, że jakiś absolwent marketingu i zarządzania wymyśli, że one były "kwantowe", bo z całą pewnością nie można ich przecież zaliczyć do "zerojedynkowych". Taki absurd może zrodzić się z powodu Brexitu, bo dla kogoś może stać się istotna narodowość tych kobiet. Wpływy Doliny Krzemowej mogą zostać zredukowane do stwierdzenia, że USA to także była kolonia Wielkiej Brytanii. Podobnie jak teza, że gigantyczne zaplecze informatyków nie mogło rozwinąć się w Indiach bez brytyjskiego kolonializmu. Lepiej jest "sprzedawać" marketingowo coś takiego, zamiast chwalenia się np szemraną działalnością Cambridge Analytica

W artykule Polityki w pierwszej kolejności poruszone zostało wiele ludzkich aspektów technoewangelizmu. W treści ostatniego akapitu można także znaleźć bardzo trafne podsumowanie. Czym jest sam proces obliczania, zawód wykonywany przez algorytmy? Niekoniecznie operacją na zerach, jedynkach czy nawet liczbach jako takich. Obliczenie to dowolny proces rozwiązywania problemu. To bardzo ogólne podejście do tematu. Łatwiej jest zobrazować to na konkretnym problemie, a dla mnie najpewniejszą dziedziną jest audio. Posłużę się z tego powodu przykładem z Dolby Atmos. Potrzebne są tu spore moce obliczeniowe, by odtworzyć dźwięk w miejscu różnym od tego, gdzie go nagrano.

Temat poruszałem już wielokrotnie i pod jednym z wpisów pojawił się komentarz, że Atmos nie jest dla muzyki. Rzeczywiście tak jeszcze jest, bo dla muzyki potrzebna jest dużo większa moc obliczeniowa. Nie ma także stosownych nagrań, bo nie wykreowano jeszcze takiej potrzeby, ale to się zmieni. Pierwszy znak pojawił się nawet w Polsce, bo latem 2018 sieć sklepów z lepszej klasy sprzętem RTV zamieściła w swoim serwisie szerszą informację pt Co to jest Dolby Atmos?. Treść zredagowana została w perspektywie RTV i jest to rzetelnie zrobione, przez co staje się ciekawym źródłem informacji, bo w języku polskim nie ma jej zbyt wiele.

Trzeba jednak brać pod uwagę, że proces tworzenia nadal trwa. Sprzęt RTV to tylko jeden z tropów, nawet gdy chodzi wyłącznie o zagadnienie związane z odtwarzaniem muzyki. Najprawdopodobniej trwają intensywne prace, by ograniczyć zapotrzebowanie na moc obliczeniową u odbiorcy. Można to osiągnąć, jeżeli w nagraniu załączony będzie kod ze "ściągawką"dla słabszych procesorów. Taki kod tworzyć mogą silniejsze maszyny w studio nagrań, czyli nowe zadanie dla realizatora nagrania. Tym samym to człowiek będzie decydował, jaki kod zostanie stworzony w postprodukcji.

Ciekawym przykładem jest tu Giorgio Moroder. Jego genialne wyczucie możliwości sprzętu do odtwarzania zapewniło sukcesy bardzo wielu artystom. Nic dziwnego, że nazywany jest "Father of Disco". Ten włoski muzyk, kompozytor i producent muzyczny świetnie wykorzystał nowe możliwości kin, gdy zostały wyposażone w sprzęt do odtwarzania filmów, jak np "Trzęsienie ziemi". Zapewniały to głośniki, które wcześniej pomogły przekroczyć w lotnictwie barierę dźwięku. Zupełnie nie dziwi przez to Oskar za wyprodukowaną w Europie piosenkę do amerykańskiego filmu Top Gun. Te głośniki były również na wyposażeniu prestiżowych dyskotek, w których dbano o najwyższą jakość. Być może tu jest sekret powstania Disco Polo - w remizach brakowało dobrego sprzętu.

Z rozwiązaniami dla Atmos nie należy sugerować się wyłącznie marką Dolby. Jest ona tutaj tylko gwarantem, że rozwój będzie w miarę skuteczny. Dolby Labs ma ogromne doświadczenie i dobrze sprawdzoną w praktyce znajomość rynku audio dla sprzętu profesjonalnego i domowego (o czym wspomniałem w marcu 2017). Teraz szlifują praktyczną widzę o rozwiązaniach dla Atmos w kinach. Tą widzę udostępniają producentom sprzętu RTV. Słabo widoczne są jeszcze działania z rynkiem komputerowym, ale ich zakres musi być znaczący. Tworzenie rozwiązań dla kin na bazie systemów wbudowanych jest za drogie. Bardziej efektywne jest korzystanie z PC. To najprawdopodobniej spowodowało, że z Windows 7 stwierdzono brak sensu dla wbudowanego Dolby, którego archaiczna technologia była tylko obciążeniem dla dalszego rozwoju. W jednym z komentarzy pod wpisem na temat nowego sterownika dla procesora dźwięku pojawił się wątek zgodności wstecz z Dolby Home Theater, co może być właśnie związane z pracami rozwojowymi Windows.

Rozwiązania dla Atmos to szerszy proces, którego potencjał dobrze obrazuje soft MathAudio. To bardzo zaawansowana technologia dla przeciętnego słuchacza muzyki, ale są bezpłatne wtyczki dla foobar, które ułatwiają poznanie tematu. Ostatnie wersje foobar są lepiej dostosowane do możliwości Windows 10 i najprawdopodobniej zostało do tego dopasowane najnowsze MathAudio Room EQ 2.7.0

W styczniu pojawiła się także wersja beta AIMP, w której widać, że trwają prace związane z dźwiękiem wielokanałowym. Chodzi o indywidualne ustawianie Channels re-mapping dla poszczególnych "formatów źródła". To jedno z miejsc, gdzie możliwe jest wprowadzenie z nagrania tego "inteligentnego" kodu, który załączony został w postprodukcji.

Podsumowanie

Świadomość, że rozwój to proces wydaje się oczywista. Niemniej nie zawsze działa. Wskazują to np komentarze dotyczące Windows 10, chociaż jest tutaj w wortalu zamieszczane tak dużo informacji w tym temacie. Brak świadomości powoduje, że możemy stać się mniej odporni na najróżniejsze manipulacje. Jakiś argument marketingowy może sprowokować np długoterminowe zobowiązanie finansowe. 

PS 10 II 2019

W wortalu pojawiła się informacja o głośnikach wibracyjnych Ferguson Vibro Stereo. Nie sprawdzałem oczywiście z nimi jakość odtwarzania muzyki, ale nie spodziewam się rewelacji. Niemniej to bardzo ciekawy produkt. Z właściwym oprogramowaniem można je skalibrować do pracy z Dolby Atmos, jako głośniki pomocnicze. Dostępne na stronie dystrybutora dane techniczne i instrukcja obsługi nic na to nie wskazują, ale na stronie głównej jest bardzo wyraźne hasło "Inteligentne rozwiązania dla domu nie muszą być drogie!"