Strona używa cookies (ciasteczek). Dowiedz się więcej o celu ich używania i zmianach ustawień. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.    X

MateCat — kot najlepszym przyjacielem nie tylko tłumacza

Witajcie w moim pierwszym wpisie. Zamierzam poruszyć w nim temat oprogramowania, o którym chyba niewiele mówiono na ramach tej strony lub blogów na niej obecnych (a przynajmniej nie w ciągu ostatnich kilku miesięcy, od kiedy ją śledzę). Nie dziwota, wszak usługa, którą chcę opisać należy raczej do narzędzi specjalistycznych, wykorzystywanych jedynie przez osoby nią zainteresowane. Ja jednak uważam, iż może się ona przydać także laikom.

Matecat (bo to on jest bohaterem tego wpisu) to open-source'owe narzędzie typu CAT (ang. computer-assisted translation, pol. tłumaczenie przy użyciu komputera). Skierowane jest ono przede wszystkim do osób zajmujących się zawodowo tłumaczeniem tekstu z jednego języka na inny. Ot działająca w przeglądarce aplikacja, która korzystając z pamięci tłumaczeniowych (ang. translation memory) pozwala w miarę szybko i wygodnie uporać się z tłumaczeniem. Pamięć tłumaczeniowa, to nic innego jak baza danych, zawierająca fragmenty tekstów w co najmniej dwóch różnych językach. Po załadowaniu tekstu do programu, zdania w nim zawarte porównywane są z pamięcią tłumaczeniową i na ich podstawie powstaje propozycja tłumaczenia.

Ok, na tym etapie pewnie niektórzy zastanawiają się "po jakiego diabła mi to wiedzieć, nie zajmuje się przecież tłumaczeniami!". Pozwólcie więc, że nim przejdę do szczegółowego opisywania matecata, wytłumaczę się z decyzji opisania akurat narzędzia tego typu. Otóż uważam, że nie trzeba być tłumaczem, by oprogramowanie wspomagające tłumaczenie przy użyciu komputera mogło ułatwić nam życie. Może się zdarzyć, iż będziemy musieli przetłumaczyć jakiś tekst z jednego języka na drugi. Nie będzie to na tyle ważny dla nas tekst, by fatygować się z nim do specjalisty (który troszkę za niego skasuje), ale z drugiej strony, ciężko nam zabrać się za niego samemu. Moje własne doświadczenia: jestem studentem translatoryki i moi znajomi dosyć często proszą mnie, bym wykonał dla nich jakieś drobne przekłady: a to kolega chce umieścić na swoim blogu wpis w języku obcym, a to koleżanka chce wystartować w międzynarodowym konkursie architektonicznym i ktoś musi przetłumaczyć jej projekt na język zrozumiały dla szerszego grona odbiorców, a to inna znajoma napisała poradnik do jakiegoś MMORPGa i chciałaby mieć jego angielską wersję, by wrzucić na jakieś międzynarodowe forum... do tego dochodziło jeszcze tłumaczenie korespondencji firmowej i inne tego typu drobnostki. Są to raczej zbyt trywialne rzeczy, by zlecać je profesjonalnemu tłumaczowi (chyba, że ktoś ma naprawdę sporo kasy), a z drugiej strony, posty na blogu czy poradniki do gier online nie należą raczej do ambitnych tekstów, trudnych w redakcji czy odbiorze. Osoba z umiejętnością posługiwania się językiem obcym na poziomie B1-B2 powinna sobie z tym poradzić. Zwłaszcza, jeśli miałaby do pomocy narzędzie, które jej tę pracę ułatwi.

I tym samym wracamy do matecata. Strona główna wygląda przejrzyście i daje nam dokładnie to, czego nam trzeba. Możemy z niej załadować tekst do przetłumaczenia, wybrać język wejściowy, a także język docelowy, wybrać temat tekstu (co pewnie ma ułatwić matecatowi w wyszukiwaniu odpowiednich rekordów w pamięci tłumaczeniowej). Plik możemy załadować prosto z naszego dysku twardego lub z Google Drive (do matecat możemy zalogować się poprzez konto Google, lub korzystać zeń anonimowo). Po wgraniu tekstu (matecat twierdzi, że obsługuje 68 formatów plików) i ustawieniu języków klikamy w duży niebieski przycisk "Analyze". Ukaże nam się wtedy tabelka ze statystykami tekstu (dla nas to raczej nieistotne informacje), którą olewamy i klikamy na "Translate".

Po kliknięciu przycisku Translate pojawi nam się okienko, z którego możemy zamówić profesjonalne tłumaczenie tekstu (wykonane przez człowieka, nie przez maszynę). Jednakże, jeżeli chcemy sami zmierzyć się z tekstem, klikamy na "Open"
Wówczas pokaże nam się okno, w którym dokonamy dzieła przetłumaczenia tekstu na inny język. Po lewej stronie znajduje się oryginał tekstu, a po prawej, jego tłumaczenie.
Pozwoliłem sobie na użycie tekstu autorstwa użytkownika wielkipiec o analizie telemetrii. Wrzuciłem fragment owego tekstu do matecata by zobaczyć, w jaki sposób kotek przetłumaczy go bez mojej ingerencji, na język angielski.
Idealnie nie jest. Pojawiły się drobne niedociągnięcia, lecz ogólne przesłanie pozostało. Owe niedociągnięcia możemy z łatwością poprawić (nie trzeba być anglistą by to zrobić), możemy też dowolnie przeredagować zdanie, tak by brzmiało lepiej. Trójkąciki i kwadraciki przed i po "surprisingly popular" to tagi. W oryginalnym tekście, w tym miejscu znajdowało się hiperłącze. Jeżeli nie usuniemy tagów, po wyeksportowaniu tłumaczenia, hiperłącze powinno nadal tam być. Dodatkowo, pomagają one zachować formatowanie tekstu. Kasowanie tagów, to ogólnie kiepski pomysł: ich usunięcie może skutkować problemami w pobieraniu lub poprawnym otwieraniu pliku tekstowego z tłumaczeniem.
W tym fragmencie rzuca się w oczy błąd na samym początku, gdzie pierwszą osobę l. poj. zamieniono na trzecią. Jest to jednak łatwe do wychwycenia i korekty. Kolejnym ciekawym błędem jest przetłumaczenie związku frazeologicznego "napisać coś na kolanie" w sposób dosłowny. Program komputerowy nie wychwytuje oczywiście takich subtelności językowych, w tych miejscach musi wkroczyć człowiek. Żadne oprogramowanie do tłumaczenia nie pomoże nam zbytnio w tłumaczeniu tekstów, w których pełno jest finezji (jak np. poezja). Przyznacie chyba jednak, że cała reszta nie wygląda tak źle (pamiętajcie, że tłumaczyła to maszyna), zwłaszcza że możemy łatwo skorygować tekst tłumaczenia.

Darujmy sobie tłumaczenie innych fragmentów, chętni mogą wypróbować matecata sami, i przejdźmy do innych szczegółów.

Jak wspomniałem na początku, matecat jest programem typu open-source, na stronie znajdziemy linki do githuba oraz inne informacje na temat projektu. Oprogramowanie jest i będzie (przynajmniej wg twórców) całkowicie darmowe, aczkolwiek istnieje możliwość wykupienia planów Gold i Platinum (ten pierwszy kosztuje bagatela 1500 euro za miesiąc, ceny drugiego nie podają), ale są to oferty skierowane do dużych firm, a nie do indywidualnych użytkowników. Matecat obsługuje naprawdę wiele języków, oferuje support oraz darmowe webinairy na tematy związane z przekładem (na webinairy trzeba się wcześniej zapisać). Support reaguje bardzo szybko, na potrzeby tego wpisu napisałem do nich, odpisali w ciągu 5 minut. Niestety, z matecata można korzystać jedynie na przeglądarkach Chrome i Safari, w przeciwnym wypadku zobaczymy taki komunikat:

Nie powinno być to jednak wielką przeszkodą, jakby nie patrzeć, przeglądarka od Google'a i tak jest używana przez większość internautów.

Rzecz jasna, programów podobnych do matecata jest całkiem sporo. Cel działania większości z nich jest podobny: ułatwić tłumaczenie tekstów. Zdarzyło mi się używać innego softu do przekładu np. darmowego WordFast Anywhere, jednakże po jakimś czasie coś skopało się z pamięcią tłumaczeniową i program przestał wspomagać mnie w translacji. Dodatkowo miał on dosyć denerwujący mechanizm obsługi tagów, a pominięcie jakiegoś taga mogło prowadzić do zabawnych, acz irytujących bugów, jak np miganie wyeksportowanego tekstu w edytorze tekstowym (sprawdzane na Word i Libre Office). W roku 2013 J. Tabor przeprowadził badanie, z którego wynikło, iż ponad 43% tłumaczy korzysta z oprogramowania Trados Studio. Jest to jednak program płatny (kosztuje niemało), co dyskwalifikuje go z użycia przez każdego, kto nie jest profesjonalistą. Dodatkowo działa on tylko na Windowsie, więc użytkownicy OS X czy Linuxa muszą obejść się ze smakiem.

Zbliżając się do końca: MateCat jest moim zdaniem dobrym rozwiązaniem zarówno dla profesjonalistów, jak i dla osób, które od czasu do czasu muszą zmierzyć się z tłumaczeniem jakiegoś tekstu. Jego obsługa wymaga wprawdzie znajomości języka obcego, aczkolwiek nie trzeba być na nie wiadomo jak wysokim poziomie. Matecat jest lepszym rozwiązaniem niż Google Translate, którego kulawe tłumaczenia wzbudzają często śmiech i politowanie (aczkolwiek, Google Translate, rozsądnie używany, także może być cenną pomocą). Nie polecałbym matecata do tłumaczenia tekstów, w którym znajduje się sporo metafor i innych subtelności, skrypty niestety ich nie wyłapią i przetłumaczą dosłownie. Takie tłumaczenie nie będzie miało żadnej wartości. Osobom nie znającym się na tłumaczeniach, nie radziłbym także samodzielnego tłumaczenia np. tekstów reklamowych lub innych oficjalnych pism. Jeśli masz firmę i chcesz np. przetłumaczyć swoją stronę internetową na język obcy, by trafić ze swoją ofertą także do osób zza granicy, lepiej poświęć trochę pieniędzy i zatrudnij profesjonalistę. On będzie wiedział, jak dostosować taki tekst do konwencji przyjętych w danym kraju. Widywałem już angielskie wersje stron czy ulotek, gdzie tłumaczenie tekstu musiało powodować u obcokrajowców atak śmiechu (o ile w ogóle byli oni w stanie zrozumieć, co autor miał na myśli). Jeżeli jednak nie są to teksty, od których zależeć mogą Twoje zyski i nie chcesz nikomu płacić, wykorzystaj zdobycze technologii i pozwól, by komputer ułatwił Ci pracę. 

oprogramowanie internet porady

Komentarze

0 nowych
DjLeo MODERATOR BLOGA  18 #1 14.05.2016 19:04

Witaj, bardzo fajny wpis jak na debiut ;) Czekam na następne...

marcin1510   8 #2 14.05.2016 21:12

Czekałem na taki wpis. I się doczekałem. Narzędzia CAT to dla mnie czarna magia odkąd zobaczyłem program OmegaT, którego nie rozumiem do dziś dzień.
Program przedstawiony przez Ciebie jest ... ciekawy, chociaż przypomina mi trochę klienta tłumacza google'a z jakimiś bajerami. Ale przetestuję, czemu nie :)

  #3 15.05.2016 07:34

Od zawsze jako podstawy używam OmegaT. Program Open Source, który jest napisany w Javie i nie udostępnia moich plików. Mam własne pliki tłumaczeń i słowniki. Nie polegam za bardzo na pracy innych.

Ciekawym dodatkiem do Open Office i Libre Office jest Anaphraseus, który działa jak WordFast. Także potrafi używać moich plików.

Nie zajmuję się zawodowo tłumaczeniem, lecz ten zestaw umożliwia mi przygotowywanie materiałów na sympozja i zjazdy. Jak wiadomo w Polsce źródeł pisanych o bardzo specyficznych i najnowszych odkryciach, opracowaniach to ze szperaczem trudno szukać. Szkoda, że tak mało w sieci wysokojakościowych tłumaczeń na wolnych licencjach. Nawet pliki udostępnione w ramach Wspólnoty Europejskiej ssą. Nasza władza chyba tłumaczyła pliki na kolanie, bo tłumacz, czy student by lepiej to zrobił. A pieniądze za zlecenie do kieszeni.

miclis   5 #4 15.05.2016 15:48

@marcin1510: z OmegaT nie korzystałem, więc się nie wypowiem, aczkolwiek wiem, że niektóre CATy są dość skomplikowane. Do takiego Tradosa to podobno nawet szkolenia organizują, by nauczyć ludzi wyciskać z tych programów 101% możliwości. Matecat jest prosty... nie ma tu żadnych bajerów, po prostu robi to co ma robić, czyli tłumaczy. Co ciekawe, zauważyłem, że lepiej sobie radzi z nieco trudniejszymi tekstami: tłumaczyłem jakiś artykuł naukowy z dziedziny bodajże socjologii i programik pięknie tłumaczył cały tekst, ja najczęściej korygowałem jedynie stylistykę tłumaczenia. Jednakże, gdy raz wrzuciłem weń zwykłego, zapisanego prostym językiem maila, niektóre fragmenty tłumaczenia wyglądały jak żywcem wyjęte z Google Translate i w efekcie większość musiałem i tak tłumaczyć sam.

Vidivarius   14 #5 15.05.2016 18:20

@miclis
A jak jakość tłumaczenia tego programu ma się do jakości innych obecnych na rynku, typu: Google, Yandex, Bing, translatory firmy Techland, translatory firmy Kompas, Translatica od PWN? Bardzo jestem ciekaw, a w szczególności jeśli chodzi o jakość tłumaczenia języków innych niż angielski, np. rosyjski, niemiecki.

Autor edytował komentarz w dniu: 15.05.2016 18:21
miclis   5 #6 15.05.2016 20:12

@Vidivarius: Ciężko mi powiedzieć, nigdy ich ze sobą nie porównywałem, aczkolwiek mógłby być to nawet ciekawy materiał do analizy. Matecata wykorzystuję do tłumaczeń z ang na pl (i z pl na ang), a z np. takiego Google Translate korzystałem raczej do tłumaczenia jakichś zdań z fr na pl i z hiszp. na pl (i na odwrót) i o ile Matecata używam do tłumaczeń specjalistycznych, Google'a używam raczej jako pomoc w nauce języka hiszpańskiego (dawniej francuskiego). Zupełnie inny rodzaj pracy. Zauważ też, że Google Translate, Translatica i Bing (tych od Kompasu i Techlandu nigdy nie używałem) dysponują nierozszerzalnymi pamięciami tłumaczeniowymi. Możliwości Matecata możemy zwiększyć i/lub spersonalizować wgrywając weń inne pamięci tłumaczeniowe (choć to opcja raczej dla tych, którzy się tym zajmują na co dzień).
Sam sposób działania Google Tłumacza (podejrzewam, że pozostałe programy tego typu działają tak samo) sprawia, że tłumaczenie nigdy nie będzie idealne. Nie tłumaczy on na zasadzie Język Wejściowy -> Język Docelowy. Zamiast tego, w większości przypadków działa to tak: Język Wejściowy -> angielski -> Język Docelowy. Nie jest to oczywiście problemem, gdy tłumaczymy coś na angielski/z angielskiego, ale w przypadku innych języków, różnice strukturalne pomiędzy 3 językami mogą być na tyle duże, że tłumaczenie, które otrzymamy, będzie mało zadowalające. Tego problemu oczywiście nie uświadczymy posiadając pamięć tłumaczeniową, która zawiera dane wyłącznie na temat dwóch języków, gdzie przekład następuje na zasadzie j. wejściowy -> j. docelowy.

Autor edytował komentarz w dniu: 15.05.2016 20:15
wiewro   2 #7 23.05.2016 08:30

A ja ciągle szukam translatora który tłumaczył by pliki pomocy typu .chm, . hlp
Z angielskiego na polski. Tu jest całkowita posucha tzn takich brak.