Google porywa się z motyką na Słońce? Chce całkowicie znieść bariery językowe

Google porywa się z motyką na Słońce? Chce całkowicie znieść bariery językowe

17.09.2013 13:03

W Google X Labs rozwijane są projekty określane jako moonshot — tak ambitne i ryzykowne, jak lot na księżyc. Należą do nich autonomiczne samochody, Google Glass, napędzane wiatrem drony, lewitacja, urządzenia do teleportacji (ten projekt został niestety zamknięty)… oraz Tłumacz Google — narzędzie znane każdemu i pod wieloma względami niedoskonałe, ale mające przed sobą wielką przyszłość.

Projektem kieruje Franz Josef Och, pochodzący z Erlangen, specjalizujący się w sztucznej inteligencji, który przeniósł się do Kalifornii aby współpracować z DARPA. W 2004 roku dostał propozycję pracy w Google. Jego zespół składa się obecnie z naukowców i programistów i, co ciekawe, nie pracuje z nimi żaden lingwista.

Od dłuższego czasu mówi się o tym, że w globalnej wiosce, jaką na Ziemi pozwolił zbudować Internet, trzeba znieść bariery językowe — wiele osób ma trudności z uczeniem się języków obcych, ale przede wszystkim zwyczajnie nie ma możliwości poznania ich wszystkich. To właśnie umożliwienie komunikacji między osobami mieszkającymi na dwóch końcach Świata jest celem zespołu pracującego nad Tłumaczem Google. Jako że nie wszystkie języki używane przez ludzi posiadają pismo, zamierzają oni zbudować całkowicie uniwersalny system tłumaczący tak samo mowę i czytany tekst, tak płynny i szybki, że nikt nie będzie go zauważał, chyba że jako szept w swoim uchu. Sercem tego systemu na razie ma być smartfon. Zespół z X Labs opracował już aplikację mobilną, która jest w stanie poradzić sobie z 12 językami, tak w mowie, jak i w piśmie. Na razie jednak działa ona powoli i korzystanie z niej jest, zdaniem kierownika projektu, niezręczne.

Obraz

Obecnie Tłumacz Google jest używany około 200 milionów razy w roku do tłumaczenia tekstów między 71 językami. Analiza struktur gramatycznych i reguł rządzących konstrukcją zdań okazała się zbyt skomplikowana i dawała słabe rezultaty, więc twórcy Tłumacza zastosowali inne podejście i robią to, w czym są najlepsi — analizują tłumaczone tekstu pod kątem statystycznym. Wynik nie bazuje więc na słowniku, ale na prawdopodobieństwie i już istniejących tłumaczeniach. Im więcej takich danych, tym lepiej. Szczęśliwie Internet pozwala systemowi uczyć się na ogromnej ilości dostępnych tłumaczeń różnych tekstów. Mechanizm wyszukuje znane już frazy i na ich podstawie oblicza najprawdopodobniejsze odpowiedniki zdań w innych językach. Na razie wyniki są zrozumiałe, ale często koszmarne — maszyna popełnia mnóstwo błędów gramatycznych i nie ma żadnego poczucia estetyki. Czy można coś z tym zrobić? Och uważa, że pozostaje jedynie doskonalić mechanizmy uczenia się automatu tak, aby był on w stanie naśladować ludzi.

Ciekawe spojrzenie na potrzebę stworzenia uniwersalnego tłumacza i w ogóle na obsługę głosem urządzeń mobilnych, także przez osoby posługujące się językami nie posiadającymi pisma, ujęli w książce The New Digital Age: Reshaping the Future of People, Nations and Business Eric Schmidt i Jared Cohen z Google'a. Wciąż większość mieszkańców Ziemi nie ma dostępu do Sieci, ale w miarę rozrastania się infrastruktury i do najdalszych zakątków naszej planety dotrze łączność. Wtedy będą potrzebne urządzenia, które nie tylko będzie można obsługiwać głosowo, bez czytania napisów, ale również zdolne przetłumaczyć dowolne teksty i odczytać je w języku ojczystym rybaka z Afryki Środkowej czy też rdzennego mieszkańca amazońskiej dżungli na niedrogim urządzeniu.

Konkurencja nie śpi. Microsoft pracuje nad własnym systemem tłumaczenia, który jest nawet w stanie zachować brzmienie głosu rozmówcy. Facebook kupił niedawno małą firmę zajmującą się automatycznym tłumaczeniem, warto też zwrócić uwagę na projekt MT@EC, rozwijany przez Unię Europejską, dzięki któremu biurokratyczna machina ma nadzieję pozbyć się przynajmniej 10% tłumaczy w ciągu najbliższych lat.

Programy

Zobacz więcej
Źródło artykułu:www.dobreprogramy.pl
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (37)