Chyba każdemu z nas zdarzyło się spróbować skopiowaćzawartość strony internetowej, tylko po to, by zorientować się,że to co zaznaczyliśmy nie jest tekstem, a ordynarnie wstawionymobrazkiem. Ręczne przepisywanie zawartości to nic przyjemnego, anie zawsze mamy pod ręką aplikację OCR, by obrazek poddaćautomatycznej obróbce. Niezłym rozwiązaniem w tej sytuacji może byćnarzędzie o nazwie Naptha.Naptha jest kompleksowym narzędziem OCR, które dla niepoznakiudaje rozszerzenie do Google Chrome. Pod względem jakościwykrywania i rozpoznawania tekstu dorównuje popularnymopensource'owym silnikom, choć oczywiście odstaje odzaawansowanych, komercyjnych aplikacji tego typu. W swoim zakresiezastosowań jest jednak wyjątkowe, dając internautom metodę nałatwe pozyskanie tekstu z praktycznie każdej grafiki.Zintegrowana z menu kontekstowym przeglądarki Naptha swojedziałanie rozpoczyna po zbliżeniu wskaźnika myszy do zawierającegointeresujący napis obrazka, rozpoczynając wówczas poszukiwaniawystępujących na nim bloków tekstu. Wykorzystuje w tym celualgorytm Strokewith Transform Microsoftu, obliczający dla każdego pikselaszerokość zawierającego go najbardziej prawdopodobnegopociągnięcia. Jako że fonty mają zwykle dość podobneszerokości, są w ten sposób łatwe do wychwycenia. Zastosowanieznanego ze specyfikacji HTML5 rozwiązania WebWorkers pozwala całyproces uruchomić w tle, nie zakłócając w ten sposób działaniasamej przeglądarki.[img=naptha]Po zaznaczeniu interesującego bloku tekstu i wybraniu opcji jegoskopiowania, zawierająca go bitmapa zostaje przesłana na serwer, naktórym działa OCR-owy silnik Ocrad. Po najdalej kilku sekundachotrzymujemy z powrotem przetworzony tekst, który można normalniewkleić, np. do dokumentu Worda czy LibreOffice. Jeśli to co zwróciłOcrad nas nie zadowala, można przełączyć w opcjach Napthy silnikna google'owego Tesseracta, który z niektórymi krojami fontówradzi sobie wyraźnie lepiej.Na tym możliwości tego ciekawego rozszerzenia się nie kończą.Z poziomu kontekstowego menu możemy wywołać mechanizm tłumaczenianapisów (obsługiwane są na razie angielski, hiszpański, rosyjski,niemiecki, francuski, chiński i japoński). Jeszcze ciekawsząfunkcją tego rozszerzenia jest usuwanie napisów z obrazków.Zaznaczając tekst na obrazku i wybierając z menu Translate opcjęErase uzyskujemy czystą, wolną od tekstu wersję, którą możnanp. skopiować do schowka. Mechanizm ten wykorzystuje algorytmypodobne do znanego z Photoshopa kontekstowego wypełniania i wwiększości wypadków przynosi dobre efekty.Więcej dowiecie się ze strony projektu – projectnaptha.com.Rozszerzenie na razie dostępne jest tylko na Chrome i chromopodobneprzeglądarki, głównie ze względu na problemy z implementacją WebWorkers dla Firefoksa. Musimy ostrzec, że ze względu na zależnośćnarzędzia od zewnętrznej usługi, może ono w każdej chwiliprzestać działać. Pomysł jednak jest na tyle innowacyjny, żemoże przyciągnąć innych programistów – może w końcu pojawisię wersja, która będzie korzystała z lokalnie uruchomionegosilnika OCR?

bEUVEqtN
Komentarze (13)
bEUVEquL