Google Docs z rozpoznawaniem tekstów OCR po polsku

01.03.2011 16:21

W Google Docs pojawiła się możliwość rozpoznawania tekstów w języku polskim za pomocą OCR. Umożliwi to zamianę przeskanowanych książek i dokumentów na dający się edytować tekst.

Rozpoznawanie tekstów zostało wprowadzone dla 29 nowych języków. Dotychczas obsługiwane były jedynie angielski, francuski, hiszpański, niemiecki i włoski. Obecnie można wybrać także język polski, rosyjski, grecki, fiński itp. Aby przekształcić wybrany plik, należy dodać go do dokumentów online, a także zaznaczyć opcję konwersji - Konwertuj tekst z plików PDF lub plików graficznych na Dokumenty Google. Po zaznaczeniu tej opcji trzeba jeszcze wybrać obsługiwany język.

OCR obsługuje dokumenty w formacie PDF, a także pliki graficzne (JPG, GIF czy PNG). Technika umożliwia dodawanie użytkownikowi plików zeskanowanych dokumentów czy książek i przekształcenie ich na tekst, który można edytować w ramach Google Docs. Rozpoznawanie tekstów OCR dla Google Docs zostało wprowadzone dla ograniczonej liczby języków w czerwcu ubiegłego roku, natomiast prace nad usługą trwały od października 2009. Jeszcze wcześniej Google przejął serwis reCAPTCHA, zajmujący się między innymi przenoszeniem do postaci cyfrowej starodruków.

Programy

Zobacz więcej