Microsoft: nasze algorytmy rozpoznające mowę są już tak skuteczne, jak człowiek

Microsoft: nasze algorytmy rozpoznające mowę są już tak skuteczne, jak człowiek19.10.2016 13:45

Mijający rok pokazał dobitnie, że największe korporacje pracują intensywnie nad nowymi metodami wprowadzania danych i interakcji z urządzeniami. I to niezależnie od zainteresowania takimi nowościami wśród samych użytkowników. Dobitnie wypowiedział się na ten temat Dave Chaplin z Microsoftu, który bez ceregieli stwierdził, że klawiatury QWERTY to przeżytek należący do XIX wieku, który trzeba zastąpić. Oczywiście mową.

A w tej kwestii Microsoft pochwalił się właśnie nie lada osiągnięciem. Na oficjalnym blogu korporacji ukazał się komunikat obwieszczający historyczny krok milowy w rozwoju algorytmów rozpoznających mowę i dokonujących jej transkrypcji. Z utrzymanego w patetycznym tonie wpisu można dowiedzieć się, że w laboratoriach Microsoftu opracowano program, który transkrybuje z precyzją równą człowiekowi.

Same deklaracje chyba nikogo nie przekonają, zwłaszcza że Microsoft już w pierwszym akapicie dopuszcza się nieścisłości. Z jednej strony dokonano przełomu w algorytmach transkrybujących, z drugiej strony mowa o rozumieniu tak dobrze jak człowiek. Nikogo chyba nie trzeba przekonywać, że rozumienie tekstu i umiejętność jego spisywania to dwie różne kompetencje.

Ba, można byłoby się nawet spierać z twierdzeniem, że znajomość semantyki jakkolwiek wpływa na jakość transkrybowanego tekstu wyjściowego. Zainteresowanych problematyką zachęcamy do zapoznania się z eksperymentem chińskiego pokoju nakreślonym przez amerykańskiego filozofa Johna Searle'a już w roku 1980.

Bardziej wyważony (i rzetelny) jest już artykuł przedstawiający wyniki badań nowych algorytmów oraz wypowiedzi samych naukowców. Do zbudowania sieci neuronowej wyspecjalizowanej, dzięki głębokiemu uczeniu, w transkrypcji posłużyła platforma Computational Network Toolkit, wykorzystywana także w tłumaczeniach maszynowych czy rozpoznawaniu obiektów na zdjęciach. Jej kod został udostępniony przez Microsoft w repozytorium GitHub.

W rzeczywistości osiągnięcie Microsoftu, jak można było przypuszczać, niewiele ma wspólnego z rozumieniem, a przynajmniej nie przekłada się to bezpośrednio na rezultaty. A te, trzeba przyznać, są imponujące. Do skuteczności transkrypcji wykorzystuje się współczynnik WER (Word Error Rate), który jest równy ilorazowi sumy substytucji, delecji i insercji oraz liczby słów w wypowiedzeniu. Najnowsze algorytmy Microsoftu osiągnęły 5,9 WER, tyle samo co biorący udział w badaniach ludzie.

5,9 to najniższy w historii odsetek błędu WER odnotowany w przypadku transkrypcji maszynowej.

Dość zabawnie wypada w tym kontekście artykuł Dlaczego Word Error Rate nie jest dobrą miarą dla algorytmów rozpoznający mowę..., który opublikowany został 1 maja 2011 roku przez... Microsoft! Mowa w nim, że WER mierzące adekwatność doboru słów pomija w dużej części kontekst, co na dłuższą metę ma obniżać precyzję maszynowej transkrypcji.

Jak widać jeden parametr (a nie są to osiągnięcia nauki ostatnich lat, prężnie rozwijającego się w zasadzie od przełomu drugiej i trzeciej dekady XX wieku maszynowego tłumaczenia nie sposób określić mianem nowej technologii) może w ciągu zaledwie pięciu lat decydować o jakości lub bylejakości algorytmu. Pomijając już niuansie, trzeba Microsoftowi przyznać, że dysponuje w tej chwili najbardziej zaawansowanym cyberskrybą. Czekamy na implementacje.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.