O sieciowych tłumaczach: Język kłamie Internetowi, a Internet myślom kłamie

O sieciowych tłumaczach: Język kłamie Internetowi, a Internet myślom kłamie05.04.2015 00:40

Stopniowe pojawianie się na rynku urządzeń i usług, które znane są fanom science-fiction od wielu lat, coraz częściej pozwala współczesnym na dumne stwierdzenie, że przyszłość jest teraz. Co ciekawe, następuje nawet sprzężenie zwrotne – znaczenie techniki, która jeszcze kilka lat temu była np. w filmach sci-fi portretowana jako jednoznacznie ułatwiająca funkcjonowanie, jest dziś często rozpatrywane w kontekście negatywnego wpływu na kondycję cywilizacji.

Rzeczywistość wirtualna, głosowe asystentki czy dostęp do wiedzy absolutnej z poziomu urządzenia mieszczącego się w dłoni może napawać dumą. Szczególnie że ma to wpływ na tak istotną cześć ludzkiego życia, jak komunikacja. Także międzyjęzykowa.

Trudno się dziwić, że stworzenie tłumacza doskonałego, wykorzystującego złożone algorytmy i głębokie uczenie, stało się jednym z najistotniejszych celów dla największych korporacji w branży IT. Mimo że na aktualnym stadium rozwoju trudno mówić o porównywaniu zysków choćby z Tłumacza Google z tymi generowanymi przez AdSense, to motywowanie rozwoju automatycznych tłumaczeń leży na zupełnie innym, wyższym poziomie. Pojawia się bowiem możliwość ujarzmienia ograniczeń w komunikacji, które towarzyszą ludzkości od końca okresu przedhistorycznego. Nigdy nie byliśmy jako gatunek tak bliscy udowodnienia, że kara za zbudowanie Wieży Babel przestaje nas obowiązywać.

Przed kupnem szampana i świętowaniem końca barier językowych należałoby jednak zweryfikować skuteczność internetowych tłumaczy, co szybko sprowadza na ziemię. Jeżeli bowiem aktualna jakość tłumaczeń oferowanych przez usługi Google'a czy Microsoftu jest dla kogoś w pełni satysfakcjonująca, to równie dobrze może on zacząć sypiać na łożu fakira – pewnie również będzie zadowolony. Dlaczego więc współczesna technika pozwala na zdobywanie wiedzy na temat odległych galaktyk, a jest umiarkowanie skuteczna w kwestii (w porównaniu) tak lokalnej, jak pokonanie barier językowych?

Podstawowym problemem są elementarne różnice w systemie konkretnych par językowych, między innymi na poziomie morfologicznym i słowotwórczym. Stąd dziesiątki dostępnych w Sieci mniej lub bardziej zabawnych obrazków prezentujących sytuacje, w których ktoś w całej swojej naiwności postanowił na przykład przetłumaczyć szyld swojego sklepiku za pomocą Tłumacza Google. Podstawowym problemem w skuteczności tłumaczeń za pomocą tej usługi jest stosowanie tłumaczenia pośredniego. Mimo dostępu do ogromnych zasobów informacji, Tłumacz wykorzystuje nie pary, ale trzy, a czasem więcej języków. Do przetłumaczenia tekstu na przykład z suomi na polski, program najpierw przetłumaczy fiński rzeczownik na angielski, a potem z angielskiego na polski. Nietrudno sobie zatem wyobrazić jak mizerny będzie końcowy efekt biorąc pod uwagę, że Finowie odmieniają rzeczowniki przez piętnaście przypadków, a Anglicy w zasadzie wcale. W ten sposób wyjściowe słowo całkowicie zatraca końcówkę fleksyjną, zgodność przypadków i po przetłumaczeniu jest zwykle mianownikiem. Polska język trudna język. Fińska także.

Tłumacz Google posługuje się modelem statystycznym, czemu w dużej mierze zawdzięcza swoją sławę, zarówno dobrą, jak i tę drugą. Pozwala to bowiem na korzystanie z ogromnych zasobów, jakie już zostały opublikowane w Sieci. Na ich podstawie oceniane jest prawdopodobieństwo, że analizowane wypowiedzenie w języku wyjściowym może stanowić przekład wprowadzonego przez użytkownika wypowiedzenia w języku wejściowym.

Brzmi doskonale, tylko dlaczego tak nie funkcjonuje? Wspomniany brak zgodności form wynikający w głównej mierze z, delikatnie rzecz ujmując, nietrafionego wyboru języka angielskiego jako pośrednika, to wierzchołek góry lodowej. Nagminnym błędem obecnym w efektach pracy automatycznych tłumaczy jest całkowita bezradność wobec homonimii językowej. Jest to zjawisko, w którym słowo z jednego języka brzmi identycznie lub bardzo podobnie do słowa z innego języka, przy czym ich znaczenie jest całkowicie inne. Przykładem niech będzie sytuacja, w której polski pies został przez silnik Microsoftu przetłumaczony na hiszpański jako... stopy (hiszp. pies). Homonimy międzyjęzykowe noszą także nazwę fałszywych przyjaciół tłumacza. Jak widać, także maszynowego tłumacza.

Kolejnym powodem niskiej skuteczności tłumaczeń maszynowych jest składnia. Na aktualnym etapie rozwoju tłumacze są w zasadzie całkowicie niezdolne do transferencji gramatycznej, czyli zdolności wynikającej z wiedzy o różnicach między językami właśnie na poziomie składni. Polega ona na umiejętności odtworzenia danej konstrukcji w języku wyjściowym, chociaż jej struktura może być w nim całkowicie odmienna od wejściowego. Jest to także typowy błąd ludzki wynikający z założenia, że przetłumaczenie każdego słowa z osobna będzie skutkowało przetłumaczeniem wypowiedzenia.

Wyzwań jest oczywiście znacznie więcej, jak choćby stosowanie różnych norm językowych. Zakłada się bowiem, że normę ustala słownik, choć coraz częstsze są głosy, że konieczne jest wprowadzenie do nich drugiej normy – potocznej. Trudno sobie przecież wyobrazić, aby w swobodnej konwersacji między znajomymi maszynowe tłumaczenie posługiwało się zawsze słownictwem stylu oficjalnego czy naukowego. Nieświadomy użytkownik mógłby nie tylko przecenić kulturę językową swojego rozmówcy, ale nawet poczuć się traktowany protekcjonalnie.

W takim świetle doskonałym podsumowaniem wydają się słowa Andy'ego Waya, naukowca z Uniwersytetu w Dublinie zajmującego się tłumaczeniami maszynowymi:

Bardziej prawdopodobne jest to, że przed uniwersalnym tłumaczem będziemy mieli wszystkie pozostałe rzeczy ze Star Treka.

lub, jak woli Tłumacz Google:Jesteś bardziej prawdopodobne, że wszystko inne w Star Trek przed kiedykolwiek dostać uniwersalny tłumacz.

Choć nie napawa to optymizmem, to niesłusznie byłoby popadać w melancholię. Szczególnie że w pracach nad automatycznymi tłumaczeniami drugorzędną kwestią zdają się, przynajmniej na razie, korzyści finansowe. Być może to naiwne twierdzić, że rozwój techniki w tym kierunku jest motywowany wielką ideą, ale pozostańmy naiwni – być może dzięki temu łatwiej będzie wierzyć, że wkrótce otrzymamy wymarzonego Uniwersalnego Automatycznego Tłumacza.

Źródło artykułu:www.dobreprogramy.pl
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.