r   e   k   l   a   m   a
r   e   k   l   a   m   a

NEWTON Dictate 4: zapisze każde słowo

Strona główna AktualnościSPRZĘT

Dla wielu osób pisanie na klawiaturze nie jest czynnością, z którą czują się komfortowo. W momencie, gdy przychodzi potrzeba by przepisać długi tekst lub spisać protokół spotkania, oblewają się zimnym potem na myśl o zarwanych nocach. Na pomoc przychodzą mechanizmy rozpoznające mowę, które zamienią głos na tekst. Tylko czy można im zaufać?

Oprogramowanie Newton Dictate 4 to nowość na naszym rynku. Po udanym testowaniu algorytmów rozpoznawania głosu w sektorze polskiego wymiaru sprawiedliwości, wydawca zdecydował się wprowadzić na polski rynek wersję „pudełkową“ programu do dyktowania NEWTON Dictate 4, którą każdy może kupić na własne potrzeby. Program od dłuższego czasu jest dostępny także na rynku czeskim i słowackim.

NEWTON Dictate 4 przede wszystkim oferuje możliwość tworzenia dokumentów za pomocą głosu – czyli po prostu dyktowania. Producent zapewnia, że będzie to dwa razy szybsze, niż pisanie na klawiaturze, ale pewnie nie wszyscy się z tym zgodzą. Nie można jednak odmówić wygody takim sposobom pracy. Wiernych użytkowników MS Office zainteresuje możliwość głosowego sterowania programami z pakietu, dzięki czemu bez dotykania klawiatury można nie tylko podyktować cały tekst, ale też wydawać polecenia i edytować dokument.

r   e   k   l   a   m   a

Obsługa programu jest dość intuicyjna. Okno główne składa się z widoku dokumentu oraz różnych palet z narzędziami, których rozszyfrowanie nie powinno sprawiać problemu. Przed rozpoczęciem nagrywania warto odsłuchać przykładowe nagranie, które pozwoli opanować specyficzny sposób wstawiania znaków interpunkcyjnych w tekście – należy bowiem mówić „nawjas” jeśli chcemy wstawić nawias, „nowalinia” w miejscu, w którym nacisnęlibyśmy Enter i tak dalej. Słowa kluczowe można przejrzeć w programie i zmieniać w miarę potrzeby. Przyzwyczajenie się do nich wbrew pozorom nie zajmuje dużo czasu.

Wyniki dyktowania są bardzo dobre. Jeśli zadbamy o odpowiedni mikrofon i ciszę w okolicy, nie ma najmniejszego problemu z zamianą mowy na tekst, nawet jeśli czytamy w tempie naturalnym i z intonacją zdań. W zasadzie zbyt dokładne wymawianie niektórych głosek powoduje, że program się gubi, gdyż w słowniku znajdują się „naturalne” zapisy fonetyczne. Nie jest to jednak problem, którego nie da się naprawić przez dodanie kolejnej definicji.

Definicja komputera wieloprocesorowego przysporzyła programowi trochę problemów, gdyż nie znał wielu słów. Kiedy jednak zostały one dodane do słownika, „wieloprocesorowy” nie zamieniał już na „wielokrotnie solowych” i poradził sobie bardzo dobrze.

Komputer wieloprocesorowy – komputer umożliwiające podłączenie kilku procesorów do wspólnej pamięci operacyjnej w celu lepszego jej wykorzystania i zwiększenia niezawodności działania. Komputery wieloprocesorowe stosowane są przede wszystkim w celu powiększenia możliwości obliczeniowych kina potrzeby realizowanych procesów przetwarzania. Komputery wieloprocesorowe charakteryzują się przeważnie możliwością pracy wieloprogramowej.

A jak wypada konkurencja? Wydawać by się mogło, że Apple czy Google postarają się o implementację dobrego rozpoznawania mowy w swoich aplikacjach, ale w porównaniu do profesjonalnego narzędzia, jakim jest Newton Dictate 4, odpadają w przedbiegach. Oto co z definicją komputera wieloprocesorowego zrobił wbudowany system zamiany mowy na tekst w systemie OS X 10.10:

Komputer wieloprocesorowych– komputera umożliwiające podłączenie kilku procesorów do wspólnej pamięci operacyjnej w celu lepszego wykorzystania i zwiększenia niezawodności działania. Komputer wielo procesowe stosowane są przede wszystkim w celu powiększenia możliwości obliczeniowych na potrzeby realizowanych procesów przetwarzania. Komputery wieloprocesorowych charakteryzują się przeważnie możliwością pracy wielu programowej.

Co ciekawe, system Apple'a doskonale poradził sobie ze znakami przestankowymi, czego się po nim nie spodziewałam. Nie zadziała on jednak, jeśli nie będzie miał dostępu do Internetu. Dyktowanie Google'a na Androidzie też nie jest idealnie. Znaki interpunkcyjne można próbować nazywać po angielsku, ale nie zawsze system zorientuje się, że chodzi o wstawienie przecinka.

komputer myślnik komputer umożliwiające podłączenie kilku procesorów wspólne pamięci operacyjnej przeboje wykorzystania komputer wieloprocesorowy myślnik komputer umożliwiające podłączenie kilku procesorów do wspólnej pamięci operacyjnej lepszego jej wykorzystania działania kropka komputery wieloprocesorowe stosowane są przede wszystkim w celu powiększenia możliwości obliczeniowych potrzeby realizowanych procesów przetwarzania kropka komputery wieloprocesorowe charakteryzują się przeważnie możliwością pracy programowej kropka

Możliwości programu obejmują nie tylko dyktowanie tekstu, ale także zmianę na tekst dostarczonych nagrań. Z plikami przygotowanymi specjalnie dla niego nie miał większych problemów, niż przy dyktowaniu. W czasie testów program dostał do przetworzenia także jeden z odcinków naszego cyklu „20 retro-lat temu”, z którym pewnie poradziłby sobie dobrze, gdyby w słowniku miał nazwy starych gier. Problemem okazały się także liczby i na początek warto zadbać o obecność liczebników w słowniku.

Na koniec Newton Dictate został rzucony na głęboką wodę – miał przepisać cały odcinek programu na żywo, w którym udział wzięły 4 osoby, przypominał więc trochę posiedzenie. Zadanie miało być trudne, ale Newton Dictate poradził sobie całkiem nieźle. Sporo zdań przetworzył poprawnie i wystarczyło dodać znaki interpunkcyjne. Nawet jeśli nie poradził sobie ze wszystkimi słowami, znacznie przyspieszył prace nad transkrypcją.

Wszystkie zadania związane z korektą można wykonać w programie, a wraz z tekstem zapisane zostanie nagranie dźwiękowe, więc niczego nie tracimy. Zadanie ułatwia automatyczne zaznaczanie słów, które zostały rozpoznane w bieżącym momencie nagrania. Dzięki temu, jeśli coś w tekście nie pasuje, można wrócić do nagrania i odnaleźć słowo. Tempo odtwarzania nagrania można zwiększyć lub zmniejszyć, by uzyskać lepszą precyzję, co zwłaszcza przy transkrypcjach wywiadów okazało się pomocne. Co więcej, jest to bardzo wygodne. Brakuje jedynie możliwości odsłuchania zaznaczonego właśnie słowa. Niestety trzeba przewijać nagrania, co w przypadku godzinnego programu jest wyjątkowo frustrujące. Ciekawie działa schowek – możemy wybrać, czy skopiowany zostanie tekst, dźwięk, czy dźwięk powiązany z tekstem.

W czasie testowania oprogramowania Newton Dictate 4 zauważyłam jednak, że w moim przypadku praca z nim jest w zasadzie… wolniejsza. Należy tu zaznaczyć, że po polsku piszę z prędkością do 350 znaków na minutę, a mówiąc w zbliżonym do tego tempie dostaję zadyszki ;-). Potem dochodzi potrzeba poprawienia drobnych błędów, których niestety w tekście wygenerowanym przez program jest wciąż więcej, niż w tym napisanym przeze mnie.

Głównym źródłem błędów bardzo długo była interpunkcja – przez kilka dni ani razu nie udało mi się za pierwszym razem zamknąć nawiasu podczas dyktowania. Z czasem jednak uzupełniłam słownik brakującymi słowami, dopasowałam definicje symboli do swoich potrzeb i udało mi się stworzyć wygodne środowisko pracy. Deklarowana przez producenta zgodność na poziomie 98% nie została wyssana z palca. Kilka tygodni pracy z programem pozwoli osiągnąć taki poziom. Po dłuższych testach, dzięki uzupełnianiu słownika, udało się przekroczyć 90% zgodności.

Jeśli chodzi o przepisywanie z książki czy papierowego dokumentu, Newton Dictate okazał się niezastąpiony. Pozwala po prostu czytać z dostarczonego materiału, bez odrywania od niego wzroku i bez zastanawiania się, gdzie skończyłam czytać poprzednie zdanie. Nie dziwię się, że protokolanci i sędziowie polubili ten program. Do pracy z gotowymi nagraniami albo do tworzenia zapisów wywiadów, które następnie zostaną poddane korekcie, Newton Dictate również będzie się nadawał, ale niestety o jego sukcesie decyduje jakość nagrania. Z tym bywa różnie i trzeba przygotować się na sporo poprawiania.

Program NEWTON Dictate 4 oficjalnie dostępny jest w sieci dystrybucyjnej Komputronik.pl. Podstawowa wersja START, przeznaczona przede wszystkim dla studentów, indywidualnych użytkowników i mniejszych przedsiębiorców, dostępna jest za 349 złotych. Według producenta wersja START umożliwia dyktowanie typowych dokumentów, korespondencji handlowej, umów, wykazów, prac semestralnych, opracowań i analiz. Słownik ogólny, który zawiera 300 000 najczęściej wykorzystywanych słów i wyrażeń, można w dowolny sposób edytować oraz dodawać do niego własne słowa. Częścią zestawu jest zestaw słuchawkowy firmy Sennheiser.

Wersja BUSINESS kosztuje 2099 złotych i daje użytkownikom możliwość dyktowania typowych tekstów biznesowych, np. protokołów z negocjacji, zebrań, korespondencji biznesowej, analiz, artykułów czy raportów. Daje również możliwość dyktowania do programów zewnętrznych, transkrypcję wcześniej utworzonych nagrań dźwiękowych z dyktafonu oraz kompletne sterowanie głosowe włącznie z kierowaniem programami MS Office. Również sprzedawany jest z zestawem słuchawkowym.

Najbardziej zaawansowana wersja PROFESSIONAL Prawo i administracja publiczna to rozszerzenie wersji BUSINESS o specjalistyczny słownik prawniczy, umożliwia więc dyktowanie dokumentów prawniczych, administracyjnych i biznesowych. Ta wersja kosztuje 4799 złotych, a w pudełku znajdziemy licencje na kilka komputerów oraz profesjonalny mikrofon USB Olympus RecMic DR-2200 wraz z aplikacją do zarządzania nagraniami.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.