Strona używa cookies (ciasteczek). Dowiedz się więcej o celu ich używania i zmianach ustawień. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.    X

Własny asystent głosowy w Windows? Zbuduj go sobie sam!

Technologia rozpoznawania mowy na przykładzie istniejących produktów takich jak Siri, Dragon Naturally Speaking lub dopiero nadchodzących Cortany i intelowskiego Jarvisa to coraz częściej poruszany temat zarówno na łamach dp jak i w innych portalach branżowych. Niesamowity postęp obserwowany w ostatnich latach w tej gałęzi informatyki jest niezaprzeczalny i wynika zarówno z rozwoju czystej myśli technicznej (sposobu przetwarzania sygnałów) jak i dostępności taniej mocy obliczeniowej. Z technologią rozpoznawania mowy rozumianą w jej potocznym (tj. użytkowym) znaczeniu od dawien dawna mamy jednak ten sam problem - mało w niej inteligencji, więcej zaś prostych reakcji przyczynowo skutkowych ukrytych pod zasłoną pustych haseł.

Tak naprawdę warstwa użytkowa gotowych systemów przeżywa... istną stagnację. Za to karmi się nas utopijną wizją wszechwiedzącego i inteligentnego automatu gotowego spełnić wszystkie życzenia, którego - mimo usilnych prób - za nic nie można dostrzec na horyzoncie. Odrzucamy jednocześnie dostępne rozwiązania, które nie odpowiadają opisem fantazjom hucznie zapowiadanym nam przez specjalistów z dziedziny marketingu. I tu popełniamy błąd.

Twórcy interfejsów głosowych niepotrzebnie starają się (już na etapie projektu) przewidzieć przyszłe zachowanie użytkownika. Limitują tym samym możliwość jego interakcji z urządzeniem. Zamiast tego powinni dostarczać im w pełni konfigurowalne rozwiązania o uniwersalnym zastosowaniu, a zatem nielimitowanych możliwościach. Pamiętam gdy po raz pierwszy przeczytałem wywiad z Olivierem Scholzem, kierownikiem zespołu "Speech User Experience for Windows Vista". Wspomniał on w nim o trwających w tamtym czasie pracach nad systemem makr umożliwiającym tworzenie własnych komend głosowych i zwiększaniem możliwości personalizacji WSR (Windows Speech Recognition, niedostępny w PL wersji systemu z powodu ograniczeń językowych). Obietnice zespół ten zrealizował, choć najwyraźniej sam system makr okazał się chyba zbyt trudny do przetrawienia dla zwykłego zjadacza chleba. A może to użytkownicy stali się... zbyt prości dla nieskomplikowanego programu komputerowego. To zmieniałoby drastycznie postać rzeczy. Czy to my idziemy na łatwiznę? Czy mamy wrodzoną lub zaszczepioną tendencję do lenistwa intelektualnego.

Za moich czasów...

Technologia rozpoznawania mowy jest z nami obecna od dawna. Zwrócę tu jedynie uwagę na początek lat 90. i schyłek świetności doskonałych komputerów Amiga. Właśnie w tamtym czasie Richard Horne udostępnił światu AniMan'a, o którym na dyskietkach z kolekcji Freda Fisha pisano, że "jest programem jakiego jeszcze nigdy nie widziałem". I słusznie... Dla małego dziecka wkraczającego w fascynujący świat informatyki widok przemawiającej trójwymiarowej głowy, która na dodatek rozpoznaje krótkie komendy głosowe i wykonuje tajemnicze skrypty ARexx'a był oszałamiający. Program działał zadziwiająco dobrze na przyjaciółkach (Amigach) wyposażonych w niewiele ponad 512KB (czasem 1MB) pamięci RAM i procesor taktowany częstotliwością 7MHz, ale rozwijał skrzydła na prawdziwych demonach szybkości minionej epoki.

Tym co istotne z poziomu naszego tematu było założenie twórcy programu AniMan, że duża część użytkowników ówczesnych komputerów wiedziała czym są i do czego służą skrypty, ba!, prawdopodobnie potrafiła tworzyć własne. I choć z perspektywy czasu była to jedynie zabawka, to jednak efekt WOW pozostał w pamięci na długo. Na tyle długo, by po wielu latach młodzieńcze zainteresowanie przerodziło się w pasję i chęć utworzenia projektu równie inspirującego, a już na pewno przełomowego jak AniMan.

Na nasze nieszczęście, raptowna informatyzacja całych społeczeństw nie poszła w parze ze wzrostem świadomości i potrzebą zwiększania swojej wiedzy, wręcz przeciwnie. Niewdzięczny, a już na pewno nieproporcjonalny podział ról nadal postępuje. Wszyscy korzystamy z rozwiązań teleinformatycznych nie wiedząc nawet na jakiej zasadzie funkcjonują. Zdolność do logicznego myślenia i relatywnie szybkiego przyswajania wiedzy powoli zastępujemy pseudonaukowymi osądami, kierując się przy tym daleko idącym subiektywizmem mającym czysto emocjonalne podłoże. Oceniamy produkty nie przez pryzmat dłuższej z nimi pracy lub posiadanych przez nie możliwości, lecz jak najprostszej z nimi interakcji. Im bardziej dany produkt zwalnia nas z konieczności myślenia, tym lepsze o nim zdanie posiadamy. Nie tak miało być. Stajemy się zakładnikami swojej własnej - nie bójmy się tego stwierdzić - głupoty. Warto o tym pomyśleć choć przez chwilę i spróbować to zmienić.

Automagiczności powiedz STOP

Gdy pod koniec 2011 roku rozpoczynałem prace nad projektem Spikit miałem przed sobą jasną wizję tego, czym powinien być uniwersalny system rozpoznawania mowy. A powinien być tylko jednym - narzędziem w rękach doświadczonego użytkownika, zdolnym wykonać każdą zaprogramowaną czynność, nie tylko utworzoną wcześniej przez autora, ale - podobnie jak we wspomnianym wyżej AniManie - zaprogramowaną przez użytkownika lub dostarczoną z zewnątrz. Ten ostatni nie musi bowiem programować czegoś samodzielnie, wystarczy, że pobierze gotowe skrypty z sieci (trochę ich na przestrzeni ostatnich lat powstało...). Dodajmy do tego relatywnie prostą obsługę, jasne i przejrzyste zasady pracy (współpracy!) z programem i gotowe. Czy to wystarczy? Niezupełnie, pozostaje zawsze czynnik ludzki, a ten potrafi nieraz doprowadzić człowieka do histerii. W najgorszym wypadku zniechęcić do dalszej aktywności ;)

Gdy koncepcja projektu ulega przeobrażeniom, warto zastanowić się nad ideałami lub głównymi przesłankami leżącymi u podstaw jego istnienia. Nie inaczej było w przypadku projektu Spikit i jego 2,5-letniej historii. To co początkowo było jego wielką zaletą (mechanizm Reguł głosowych), w chwili zwątpienia stało się największym ciężarem (brak zrozumienia), by niedługo potem ponownie nabrać blasku (oświecenie?). Ach, ta przewrotność. Poznaj Spikit, niezwykły system rozpoznawania mowy.

Dostępna od ponad miesiąca nowa wersja tego oprogramowania, czyli Spikit 1.5.x, dzięki kilku prostym zabiegom może stać się Twoim osobistym asystentem głosowym, o którym zawsze marzyłeś. Teraz. Nie jutro, za miesiąc, czy rok. Nie, gdy rynek PC będzie na niego - z marketingowego punktu widzenia - gotowy, lecz w tej chwili. Nie na super-komputerze, a na sprzęcie jakim aktualnie dysponujesz. Pytanie tylko, czy Ty jesteś na to gotów? Czy wiesz czego chcesz, czy może wolisz być tylko biernym obserwatorem?

Weź sprawy w swoje ręce

A raczej: zacznij mówić. Mimo niewielkich różnic w numeracji, kolejne aktualizacje programu wprowadzają znaczne ulepszenia lub pełnią rolę odpowiedzi na zgłaszane przez użytkowników sugestie. Nierzadko są to przełomowe zmiany. Tak było także i w tym przypadku. W efekcie, Spikit 1.5 uległ bardzo pozytywnej transformacji, eliminując błędy poprzedników i otwierając nowe perspektywy wykorzystania programu w naszym codziennym życiu. Zachowując pierwotną ideę, mechanizm tworzenia własnych komend głosowych oferuje teraz niespotykane nigdzie indziej możliwości. Nie jest przy tym sztucznie ograniczony, wręcz przeciwnie - wspiera kreatywność użytkowników. Wymaga jednak intelektualnego zaangażowania.

Zalety usprawnionego mechanizmu Reguł głosowych przedstawiłem już w krótkiej serii filmów tuż przed oficjalnym wydaniem publicznej wersji programu. Jak się następnie okazało, z wersji kandydującej ;) Mimo późniejszych, niewielkich modyfikacji, filmy te nie utraciły na aktualności, więc prezentuję je poniżej z nadzieją, że okażą się pomocne.

Tym co warto tu podkreślić jest wyjątkowa zdolność programu Spikit do bezproblemowej współpracy z każdym innym oprogramowaniem (np. z systemowym Narratorem, szczególnie w jego zaktualizowanej wersji w Windows 8!). Dzięki temu Spikit likwiduje problem bycia pseudointeligentnym automatem i pozostawia Tobie, użytkownikowi, wybór konkretnych narzędzi do realizacji konkretnych celów. Spikit nie musi informować Ciebie o prognozie pogody, ani pełnić roli zaawansowanego czytnika ekranowego. Wystarczy natomiast, że pełni rolę inicjującą prace innych, bardziej specjalistycznych narzędzi, które utworzone zostały w konkretnym celu jakim może być np. głosowe informowanie o stanie pogody lub przebiegu trasy z jednego miejsca w inne. Wystarczy, że Spikit pełni rolę katalizatora i zwiększa wydajność Twojej pracy lub rozszerza możliwości cyfrowej rozrywki! Taką właśnie rolę spełniać mają systemy rozpoznawania mowy przyszłości. AutoCAD sterowany głosem? - nie ma problemu (przypomnij sobie pracę Tony'ego Starka w pracowni i jego konwersacje z filmowym JARVIS'em, a zobaczysz uderzające podobieństwo). Nawet w przypadku aplikacji takich jak Photoshop, Twoja interakcja z komputerem nie musi ograniczać się do klikania lub, zgodnie z aktualnym trendem na rynku, mazania palcem po ekranie dotykowym. Wykorzystaj swoją wyobraźnię i zapisz swoje myśli w postaci Reguły głosowej, schematu określającego sposób komunikowania się z maszyną, by zaraz potem móc do niej faktycznie przemawiać. Właśnie w tym celu powstał Spikit, aby integrować ze sobą istniejące rozwiązania, a nie je zastępować. Spikit to interfejs głosowy dla rzeczy, które widzisz na ekranie.

Odnośniki do pozostałych części prezentacji:

Krótka wizja przyszłości

Spikit jest w połowie drogi ku jeszcze większej wolności jego użytkowników. Czy dotrze tam w niezmienionej postaci? Któż wie... niemniej obecna forma wydaje się być niezwykle stabilna, bo oparta na dobrze przemyślanych fundamentach wspartych sugestiami stale powiększającej się społeczności użytkowników. Istnieją jeszcze obszary wymagające drobnych usprawnień (błądzić jest rzeczą ludzką...), ale też i pomysły, które mogą zrewolucjonizować sposób w jaki komunikujemy się z naszymi urządzeniami (niezależnie od tego czy są to tablety, laptopy czy stacjonarne pecety).

Najważniejsze i najpilniejsze z tych pomysłów to obecnie:

  • implementacja potoków nazwanych lub podobnego mechanizmu komunikacji między procesami, dzięki którym wyniki rozpoznawania mowy mogłyby być w prosty sposób wykorzystywane nawet przez początkującego użytkownika-programistę do jego własnych celów
  • zdolność do automatycznego wczytywania zbiorów poleceń przygotowanych specjalnie dla wykorzystywanej w danej chwili aplikacji (teraz można tego dokonać tylko na żądanie)
  • możliwość wypowiadania na głos komunikatów z okien dialogowych (na systemach starszych niż Windows 8, na których Narrator nie jest dostępny lub nie można nim sterować za pomocą skrótów klawiszowych, a w efekcie za pomocą własnych poleceń głosowych)

Wyraź swoje poparcie

Jeśli tak jak ja pasjonujesz się nowymi technologiami, rozpoznawaniem mowy lub innymi metodami komunikowania się ze sprzętem, zwłaszcza ich użytkowym zastosowaniem - wypróbuj Spikit. Odnajdziesz go w bazie dobrychprogramów, jak i na oficjalnej stronie projektu. Aplikacja w wersji bezpłatnej działa z niewielkim opóźnieniem.

A jeśli masz pytania lub szukasz okazji do wymiany poglądów na temat samego programu lub idei głosowego sterowania PC, weź udział w dyskusji zarówno tu jak i na stronie Spikit (tam komentarze biją kolejne rekordy długości...).

A gdy Spikit przypadnie już Tobie do gustu - nie zapomnij dać mu lajka na Facebooku, Spikit na FB pozytywnie zaskakuje zarówno treścią jak i kulturą przekazu informacji.
 

windows oprogramowanie hobby

Komentarze

0 nowych
ximian   1 #1 08.02.2014 21:04

Ja zrobiłem tak, że (pod Linuksem) nagrywa twoje polecenie, wysyła wynik, odbiera tekst i wykonuje akcje
Fajnie działa :P (ale wymaga internetu)

FullFrame   1 #2 08.02.2014 21:53

Gadający zegar:
próbowałem zintegrować zanany program Ivona Reader ze Spikitem.
Niestety skróty klawiszowe w IR mocno kolidują z popularnymi programami i nie można ich modyfikować. Polecam program Talking Desktop Clock, posiada bardzo dużo opcji. Można go całkowicie ukryć i z reguły głosowej 'godzina' wypowie aktualny czas. Jedną z najbardziej ciekawych opcji jest spersonalizowanie jaki głos, może być angielsko języczny-posiadam taki, wypowie godzinę.
pozdr

xomo_pl   21 #3 08.02.2014 22:29

@alucsoftware ja rozumiem, że żyjesz nie jako z tego softu ale nie ładnie tak nie doceniać konkurencji :=)
Osobiście korzystam z angielskiej edycji Windows więc do Speech recognition mam dostęp i złego słowa o tym powiedzieć nie dam- całkiem przydatne narzędzie. Od Windows8 wreszcie każdy może je wypróbować- wystarczy dograć pakiet językowy (an, francuski, niemiecki, japoński lub chiński) bez względu na wersję Windows.

Vidivarius   14 #4 08.02.2014 22:34

Program bardzo interesujący. Chętnie bym go zakupił, ale niestety 246 PLN to zbyt wygórowana cena. Dla przykładu - za całkiem dobre translatory płaci się ok. 150 PLN, a wymagają chyba większego nakładu pracy, poza tym bez nich trudniej się obyć niż bez takiego wspomagacza jakim jest Spikit (chyba że mowa o ludziach z inwalidztwem). Za taki program zapłacę nie więcej niż 60 PLN. Gdyby jeszcze Spikit miał funkcję zamiany tekstu mówionego na pismo, to zmieniło by diametralnie aktualny stan rzeczy - byłby _absolutnie_ wart swojej ceny.
Pozdrawiam twórcę i życzę powodzenia.

max1234   10 #5 08.02.2014 22:38

@Vidivarius, Spikit ma funkcję zamiany tekstu mówionego na pismo - jest to funkcja Dyktowanie i korzysta albo ze skonstruowanego przez ciebie słownika, albo z usługi rozpoznawania mowy Google :)

alucosoftware   7 #6 08.02.2014 22:47

@FullFrame
Mam w planie napisać porządny poradnik jak krok po kroku wykorzystać cały potencjał programu (sposób wykorzystania przez niektórych użytkowników Spikit przechodzi najśmielsze oczekiwania... :).

@zomo_prl
Ależ ja wszystkich doceniam. WSR ma porządny system makr i działa bardzo przyzwoicie. We wstępie poruszyłem zupełnie inną kwestię. Rynek (czyli "bardzo przeciętni użytkownicy") wymaga produktów prostych. Zbyt prostych. Ciężko będzie to wszystko kiedyś odwrócić. Nie będziemy rozumieli podstaw działania aplikacji - wszystko stanie się automagiczne/inteligentne. Już teraz można dostrzec pierwsze tego objawy. Wystarczy poczytać o tych wszystkich inteligentnych programach w bazie dp, które wykonują prozaiczne czynności w sposób całkowicie pozbawiony inteligencji, postępując jedynie zgodnie z ustalonym wcześniej schematem ;)

alucosoftware   7 #7 08.02.2014 22:55

@Vidivarius
Poświęć kilka chwil i zapoznaj się proszę z tymi pięcioma krótkimi filmikami, a zobaczysz do czego zdolny jest program. Spikit w wersji bezpłatnej posiada wszystkie możliwości płatnej edycji, ale ponieważ akcje wykonywane są z losowym opóźnieniem (od 1 do 15 s) - wymaga więcej cierpliwości.

xomo_pl   21 #8 08.02.2014 23:11

@alucsoftware, każda aplikacja znajduje swoich odbiorców- jeden user woli jak coś mu się "samo" zrobi a drugi (głównie pro userzy) woli sam grzebać i nie lubi automatów. Dlatego myślę, że nie ma co narzekać na takie aplikacje :)

alucosoftware   7 #9 08.02.2014 23:44

@zomo_prl
Dokładnie. Po prostu moja wizja świata jest odmienna od rynkowego konsensusu. Do opisu swojego świata używam innego języka, w którym nazywanie rzeczy inteligentnymi ma miejsce tylko wtedy, gdy rzeczywiście przejawiają takie zachowanie. Dzielę się swoimi spostrzeżeniami, bo wiem, że mogą wpłynąć na decyzje czytelników i wiele osób ma podobne zdanie.

Drobny przykład:
Spikit posiada możliwość uruchamiania innych programów (powiązania słów/zdań z akcją uruchomienia czegoś) - ot, niezwykle prosta funkcja. Ale konsekwencje takiego stanu rzeczy są znaczące, wręcz olbrzymie. Oznacza to, że Spikit może wykonać K A Ż D Ą czynność o jakiej tylko pomyślę. Mogę więc założyć, że możliwe jest za pomocą programu odczytanie na głos ostatniej wiadomości e-mail, jaką odebrałem. Czy program potrafi tego dokonać domyślnie? Nie (tak, ale mija się to z celem). Mogę jednak napisać krótki skrypt, powiązać go z własną mową i voila! Tego użytkownicy nie wiedzą, a według mnie powinni... Z tym, że na razie jest inaczej i takie sztuczki stoją za rzekomą 'inteligencją' wielomilionowych produktów.

  #10 09.02.2014 10:25

Opóźnienie do 15 sekund? Wersja bezpłatna jest całkowicie bezużyteczna, uczciwiej byłoby nazwać ją wersją demo. Cena zbyt wysoka, szczególnie wersji dla firm.

stasinek   11 #11 09.02.2014 11:06

Pogubiłem się czytając tekst pomieszanych treści
opisu własnego programu, marketingu wychwalającego jakiż to on fajny i inteligentnego bełkotu obrażającego ludzi który tłumaczy ewentualne jego niedociągnięcia.
nie można jaśniej?
np.
"implementacja potoków nazwanych lub podobnego mechanizmu komunikacji między procesami, dzięki którym wyniki rozpoznawania mowy mogłyby być w prosty sposób wykorzystywane nawet przez początkującego użytkownika-programistę do jego własnych celów"
blablablabla
że co?
no wyduś to z siebie ludzkim głosem!

alucosoftware   7 #12 09.02.2014 11:55

@stasinek
Bądź tak łaskawy i wskaż mi zdania, oczywiście bez wyrywania ich z kontekstu, które obrażają czytelnika.

"Potok nazwany" to nic innego jak "potok nazwany". Z potokami nazwanymi mamy do czynienia od początków istnienia systemów operacyjnych. Mogę przywołać jego angielski odpowiednik - "named pipe", ale będzie on równie tajemniczą nazwą dla czytelnika jak "potok nazwany", jeśli - co poruszam w tekście - wybierze on drogę świadomej negacji podstawowej wiedzy. W 21. wieku można w kilka sekund odnaleźć definicje trudnych lub niezrozumiałych dla nas pojęć (np. w Wikipedii). Sam tak czynię i gorąco polecam tę metodę przyswajania wiadomości.

I "przepraszam", że używam takiego podniosłego języka (bełkotu? słowo "inteligentny" pojawia się w tekście w zupełnie innym kontekście). Nie ma w tym sztuczności. Tak już mam, cenię sobie kulturę wypowiedzi. Problem braku zrozumienia tekstu pisanego nie leży po mojej stronie.

Użytkownikom programu, obecnym lub przyszłym przekazuję informacje w taki sposób, w jaki sam oczekiwałbym informacji zwrotnej (np. podczas opisu trudności/defektu w programie). To działa, ale trzeba do tego dorosnąć.

stasinek   11 #14 09.02.2014 12:10

znowu to samo "ale trzeba dorosnąć" za kogo ty mnie masz co?

  #15 09.02.2014 12:14

Na Ubuntu już dawno takie rzeczy można robić, nawet na podstawie siri.

alucosoftware   7 #16 09.02.2014 12:15

@up
Za zagubionego człowieka, przez którego niepotrzebnie przemawia złość/agresja lub bardziej odpowiednie słowo.

Protected_48   3 #17 09.02.2014 13:28

Program jest bardzo fajny. Ale prawdopodobnie ma na celu bardziej promowanie firmy niżeli faktyczne zarabianie. Takie jest moje zdanie, bo jeszcze nie zobaczyłem aby tego typu programy były w masowej skali używane przez użytkowników.

  #18 09.02.2014 13:56

Przekonuje mnie "AutoCAD sterowany głosem".
Ale czy to działa offline?
Dlaczego nazwałeś to Spikit a nie PowiedzTo, dla polaków to jest czy dla kogo?

stasinek   11 #19 09.02.2014 15:41

zadam pytanie inaczej - za kogo Ty siebie masz? z tekstu wnioskuje, że niezwykle kulturalnego człowieka oczekującego kultury od innych i zwalczania przejawów głupoty od ludzi, jednak wykluczasz możliwość że Twój tekst może być przeintelektualizowany i naszpikowany sloganami?
napisałem to bez złości przywołując sympatycznego wiercika bo pogubiłem się czytając
nawołujesz abym dorosnął w tej samej wypowiedzi dziwiąc się gdzie rzekomo obrażasz czytelnika :>
wykluczasz wykonanie pracy umysłowej przez siebie oczekując od innych
i mam wrażenie ze program jest tego odzwierciedleniem
nie dziwię się też że projektujesz na mnie agresje i złość, typowa dla świata informatycznego przypadłość pozorna grzeczność podszyta sam dobrze wiesz czym

jeśli zaś chodzi o program - funkcjonalność którą bardzo chętnie bym zobaczył(a może ona już jest?) to możliwość stworzenia własnego 3PO - asystenta tłumaczeń równie sprawnie wypowiadającego polskie( i nie tylko) zdania jak BCD Translator na Blackberry ale w odróżnieniu od niego - rozpoznającego mówiony tekst nie tylko wpisywany
w dowolnym języku nawet jeśli jest to piosenka lub film
program zastąpił mnie podczas głosowej niedyspozycji w pracy - mówienie kobiecym głosem było bardzo zabawne ale nie było innego wyjścia :>
co dziwne - program działający w oparciu o API Google Translatora robi to lepiej niż inne tego typu - płynnie

alucosoftware   7 #20 09.02.2014 15:44

@Protected_48
Dzięki. A czy nie przekonuje Ciebie przykład Dragon Naturally Speaking (wykorzystywany na masową skalę)?

@Kellu
Tak, działa offline od samego początku. W przyszłości Spikit będzie wspierał także inne języki.

alucosoftware   7 #22 09.02.2014 16:27

@stasinek
Muszę ponowić #12 i poprzeć go #9. Być może niepotrzebnie dochodzi tutaj do słownych potyczek. Opisywanie tego samego innymi wyrazami to, z logicznego punktu widzenia, strata czasu i mojego i Twojego.

Jeżeli zaś chodzi o funkcjonalność produktu, to w Spikit możesz wykorzystać komendy !Bang z wyszukiwarki DuckDuckGo. Dzięki nim rozpoznany tekst wklejany jest w adekwatnym miejscu w URL serwisu, z którego chcemy skorzystać (tworząc w ten sposób standardowe "pytanie"). Możesz wywołać stronę Google Translate za pomocą polecenia podobnego do zaprezentowanego poniżej:

przetłumacz zdanie {!gtranslate}

Rozpoznany tekst zostanie od razu przetłumaczony przez Google Translate, zmiany języka docelowego możesz już dokonać za pomocą przycisków umieszczonych na stronie (czyli również za pomocą komend głosowych - patrz Asystent w Spikit). Jeśli ten sposób wydaje się niewystarczająco szybki, można utworzyć skrypt, który - gdy dodam obsługę "potoków nazwanych" - otrzyma od Spikit transkrypcję mowy i wykona wszystko znacznie lepiej. Zresztą o to właśnie w Spikit chodzi.

FullFrame   1 #23 09.02.2014 18:23

@alucosoftware
"Mam w planie napisać porządny poradnik jak krok po kroku wykorzystać cały potencjał programu (sposób wykorzystania przez niektórych użytkowników Spikit przechodzi najśmielsze oczekiwania... :)"

Genialnie!!!
Sam jestem userem raczej "średniej półki" a już ogarniam cały program, jednak wskazówki dot. innych rozwiązań dla Spikita będzie już dopełnieniem jego wykorzystania.
Pozdrawiam i czekam z niecierpliwością.

alucosoftware   7 #24 09.02.2014 18:48

@FullFrame
Dwie drobne, acz znaczące wskazówki dotyczące współpracy Spikit z przeglądarkami internetowymi (IE, FF, Chrome) oraz wykorzystaniem niestandardowego głosu syntezatora mowy (Microsoft Paulina Dekstop lub głosy firmy IVONA) znajdziesz pod poniższymi adresami.

Współpraca z IE, FF, Chrome:
https://www.facebook.com/photo.php?fbid=581998958545964&set=a.41155045559081...

Zmiana głosu syntezatora mowy w Spikit:
https://www.facebook.com/permalink.php?story_fbid=374856422629587&id=3436371...

FullFrame   1 #25 09.02.2014 19:24

@alucosoftware
Wszystkie rady z facebooka już przemaglowane z 10 razy, jestem na bieżąco;) :):)
Zakupiony pakiet głosów z Ivony też daję duże możliwości odsłuchowe ze Spikitem.

Myślę że kreatywność userów użytkujących Spikita będzie ciekawym spojrzeniem na inne wykorzystanie programu.
Pozdr.

arlid   14 #26 10.02.2014 19:56

Jest moc :D Ciekawy wpis. Fajnie, ze aplikacja się rozwija.

alucosoftware   7 #27 11.02.2014 15:01

@arlid
Szkoda, że nie mogę poświęcić więcej czasu na jej rozwój. Gdyby aplikację rozwijał cały zespół - oj, to by się dopiero działo...

arlid   14 #28 11.02.2014 19:11

@alucosoftware
Patrząc na fakt, że aplikację rozwijasz sam to jest ogromna funkcjonalnie. Projekt bardzo przyszłościowy - a niedawno tylko w "formie" science fiction.