Jarvis: autorski system rozpoznawania mowy offline od Intela

Jarvis: autorski system rozpoznawania mowy offline od Intela

Jarvis: autorski system rozpoznawania mowy offline od Intela
Tomek Kondrat
29.01.2014 13:14

Technologia rozpoznawania głosu, znana m.in. z systemów iOS i Android, jest dostępna na urządzeniach mobilnych już od dłuższego czasu. Siri, bo taką nazwę nosi asystentka dostępna w iOS, została zaprezentowana w 2011 wraz z premierą iPhone'a 4S i od tego czasu zyskała sporą grupę użytkowników. Analogicznym rozwiązaniem na Androidzie jest iris., wydana przez hinduskie studio Dexetra lub dużo popularniejsze Google Voice.

Pomimo sporej popularności Siri nie uniknęła kłopotów, mając na przykład znaczące trudności z przetworzeniem poleceń wypowiedzianych ze szkockim akcentem. Kolejną trudnością, z jaką borykają się systemy rozpoznawania mowy, jest prędkość działania, która jest po prostu zbyt mała. Przetworzenie polecenia trwa dłuższą chwilę i nie zawsze zwraca poprawne wyniki. Źródłem problemu nie jest oprogramowanie, które jest dużo dokładniejsze niż dwa lata temu, lecz sama architektura usług, używana zarówno przez Apple, Google jak i Microsoft. Aby rozpoznać mowę, urządzenia z oprogramowaniem tych firm wysyłają skompresowany plik dźwiękowy do centrów danych oddalonych o setki, a nawet tysiące kilometrów, gdzie mocne serwery przetwarzają głos na tekst i wysyłają odpowiedź. W połączeniu z niezbyt wydajnymi procesorami w urządzeniach mobilnych daje to rezultat daleki od oczekiwanego. Google co prawda opracowało system rozpoznawania mowy w trybie offline, jest on jednak niedostępny dla niezależnych twórców aplikacji. Kolejną rzeczą, o której należy wspomnieć jest fakt, że system wykorzystujący chmurę jest po prostu dużo dokładniejszy.[img=intel-edison]Z inicjatywą mającą na celu usprawnienie obecnie stosowanego systemu wyszedł amerykański producent podzespołów bazowych – Intel. Amerykańska firma nawiązała współpracę z nieznanym z nazwy producentem (którym według doniesień jest firma Nuance) i rozpoczęła pracę nad systemem rozpoznawania mowy na tyle szybkim, aby był w stanie rozpoznać ludzką mowę i na tyle małym, by zmieścił się w obudowach współcześnie produkowanych urządzeń. Fani „Iron Mana” mogą czuć się usatysfakcjonowani, gdyż zaprezentowany prototyp będzie nosił nazwę Jarvis. Zbieżność nazw jest w sposób oczywisty przypadkowa. Jarvis jest w stanie przetworzyć wydane polecenia, jak również odpowiadać swoim własnym głosem, przez co możliwa jest zarówno kontrola urządzenia oraz używanie systemu jako osobistego asystenta. Zaletą takiego rozwiązania jest uniknięcie używania chmury do dekodowania poleceń głosowych, a co za tym idzie, możliwość korzystania z systemu bez aktywnego połączenia internetowego.

Mike Bell, szef działu odpowiedzialnego za projekt posunął się nawet do następującego porównania:To wkurzające, gdy spędzasz czas w Yosemite [park narodowy w USA, przyp. red.], a twój osobisty asystent nie działa, gdyż nie jesteś podłączony do Internetu. Jasne, że Twój asystent nie zamówi stolika w restauracji, gdy nie ma połączenia z chmurą, lecz dlaczego nie może uruchomić Google Maps albo wyciszyć telefonu?Bell zapowiedział, że Intel pracuje nad sprzedażą swojego autorskiego systemu rozpoznawania mowy dla producentów urządzeń mobilnych, których nazwy nie zostały ujawnione. Wprowadzenie Jarvisa na rynek w znaczący sposób usprawni systemy rozpoznawania mowy, dzięki czemu będą w stanie odpowiadać na nasze zapytania tak szybko, jak zrobiłby to człowiek, lub nawet szybciej. W rezultacie w niedalekiej przyszłości użytkownik będzie mógł „poprosić” telefon o wysłanie wiadomości do Tomka, a telefon sam zapyta, którego Tomka miał na myśli. Jedyne czego brakuje, to umożliwiający latanie strój, bo Jarvis już czeka w gotowości.

Programy

Zobacz więcej
Źródło artykułu:www.dobreprogramy.pl
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (11)