Blog (22)
Komentarze (619)
Recenzje (0)

Od zera do spikera - sterujemy komputerem za pomocą głosu cz. 3

@alucosoftwareOd zera do spikera - sterujemy komputerem za pomocą głosu cz. 310.03.2014 16:07

Komputer to nadal bezduszne narzędzie i bez cienia wątpliwości twierdzę, że nieprędko (o ile w ogóle) taki stan rzeczy ulegnie zmianie. Możemy jednak komunikować się z nim w całkiem ludzki sposób, tak jak z drugim człowiekiem, używając abstrakcyjnych pojęć i nośnika informacji jakim jest stara, wysłużona fala akustyczna.

Halo? Czy jest tam ktoś?
Halo? Czy jest tam ktoś?

Jak mówić do komputera, aby ten nas rozumiał? Najlepiej wykorzystać jakieś oprogramowanie, które wyszuka w naszej mowie wcześniej ustalone (zaprogramowane) komendy głosowe i podejmie właściwe dla tych poleceń działania. Aplikacją zdolną do podejmowania takich działań, obsługującą język polski, działającą szybko i sprawnie, jest Spikit. Ten tekst ma na celu pokazać, że utworzenie własnego asystenta głosowego może być bardzo proste i przyjemne.

Lekcja 3

W poprzednich dwóch częściach kursu (część 1, część 2 ) mieliśmy okazję zapoznać się z podstawowymi prawami rządzacymi światem tzw. Reguł głosowych. Utworzyliśmy przykładową listę z poleceniami głosowymi. Dowiedzieliśmy się również, że lista taka może przybierać różną postać i uzwględniać wiele scenariuszy, w których znaleźć się może użytkownik. Dziś zapoznamy się z właściwością Reguł głosowych, której warto poświęcić osobny wpis. W następnych częściach zajmiemy się już upragnioną konfiguracją programu w całej jego okazałości i przygotujemy nasz PC do pracy z użyciem naszego głosu.

Mów do mnie jeszcze...

Spikit 1.5+ nie jest wyłącznie oprogramowaniem, do którego tylko my, jego użytkownicy, możemy mówić! Nic nie stoi na przeszkodzie, aby zmusić komputer do przemówienia do nas. Technologie rozpoznawania mowy i jej syntezy wzajemnie się uzupełniają. Dzięki takiemu połączeniu i wynikającej z tego dwukierunkowej komunikacji, wrażenia z używania osobistego asystenta głosowego są o wiele bardziej bogate. W przypadku oprogramowania z naszego rodzimego podwórka, komputer może:

  • powtórzyć po nas wszystkie wypowiedziane przez nas komendy
  • wypowiedzieć rozpoznane zdania, których transkrypcja przebiegała z użyciem lokalnego Słownika lub przy użyciu modułu sieciowego
  • poinformować nas o swym stanie, zaistniałych zmianach w konfiguracji
  • wyartykułować odpowiedzi, które przypisaliśmy do poszczególnych poleceń w Regule głosowej

Pierwsze trzy z przywołanych wyżej cech Spikit można określić mianem zwyczajnych komunikatów głosowych i zarządzać trybem ich wypowiadania w dość prosty sposób tj. można włączyć lub wyłączyć tę funkcję programu tak jak zaprezentowałem to na poniższym filmie: [yt=http://www.youtube.com/watch?v=FDZL0qVrKhs]

Ostatnia właściwość, czyli odpowiedzi głosowe, wymagają zaangażowania naszej inwencji twórczej. Tak jak każdemu poprawnemu poleceniu możemy przypisać tylko jedną akcję, tak też każdej nowej komendzie możemy przypisać dokładnie jedną odpowiedź głosową, choć równie dobrze nie musimy tego robić wcale. Aby przypisać odpowiedź głosową do polecenia głosowego, tuż po zdefiniowaniu akcji wytarczy umieścić znak dwukropka i wpisać jakiś tekst zgodnie ze schematem:

W najnowszej wersji Spikit możemy wykorzystywać specjalną akcję NULL, którą dodałem do programu za namową użytkowników, by ułatwić tworzenie poleceń służących jedynie 'konwersacji' z naszym komputerem. Dzięki temu będziemy mieli pewność, że rozpoznanie polecenia nie będzie wiązało się z wykonaniem przez program jakiejkolwiek sensownej czynności poza wypowiedzeniem stosownego komunikatu. Oczywiście mechanizm ten najlepiej sprawdza się w sytuacji, gdy nie spoglądamy akurat na ekran urządzenia. Spróbuj samodzielnie utworzyć podobny zestaw komend:

Tryb wypowiadania odpowiedzi głosowych jest w Spikit włączony domyślnie. Możesz więc sprawdzić sposób działania własnych poleceń od razu. Prostota z jaką możemy przypisywać odpowiedzi głosowe do poszczególnych komend przemawiają na korzyść programu. Choć tak naprawdę nadal mamy tu do czynienia z rozszerzonym monologiem, od naturalnej rozmowy z PC dzieli nas już bardzo niewiele. Funkcja ta nie ma na celu zastępować wyspecjalizowanych czytników ekranu, których dobrym przykładem jest systemowy Narrator w Windows Vista i wyżej, a jedynie zwiększyć interaktywność Spikit i ogólny odbiór technologii rozpoznawania mowy. Można na tę funkcję programu spojrzeć z innej perspektywy. Jaką radość sprawiałoby Tobie mówienie do ściany?! No jaką? :-)

Odpowiedzi głosowe to absolutna konieczność :-)
Odpowiedzi głosowe to absolutna konieczność :-)

Na pochwałę zasługuje tu postawa jednego z użytkowników programu, który we własnym zakresie tworzy programy pomocnicze współdziałające ze Spikit i rozszerzające pierwotną ideę. Cała dyskusja dobrze odzwierciedla sentencję "potrzeba jest matką wynalazków", więc z przyjemnością przekierowuję Czytelnika do całego wątku. Być może i Ty znajdziesz tu zalążek inspiracji.

Nowa wersja właśnie dostępna

Czy wiesz, że wraz z aktualizacją do wersji Spikit 1.5.2.0, bezpłatna wersja programu działa teraz dwukrotnie szybciej (opóźnienie zredukowane do 8 sekund), zachowując ten sam nieskończenie duży potencjał? Spikit lepiej radzi sobie teraz z treścią wyświetlaną na ekranie. Usprawnienia widoczne są począwszy od systememu Windows XP, a skończywszy na najnowszej wersji Windows 8 z trybem kafelków.

Garść najświeższych informacji, w tym opis wprowadzanych poprawek, znajdziesz na stronie programu na Facebooku.

Wybrane dla Ciebie
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.