Naptha: rozszerzenie OCR dla Chrome, za pomocą którego wydobędziesz tekst z obrazków

Chyba każdemu z nas zdarzyło się spróbować skopiowaćzawartość strony internetowej, tylko po to, by zorientować się,że to co zaznaczyliśmy nie jest tekstem, a ordynarnie wstawionymobrazkiem. Ręczne przepisywanie zawartości to nic przyjemnego, anie zawsze mamy pod ręką aplikację OCR, by obrazek poddaćautomatycznej obróbce. Niezłym rozwiązaniem w tej sytuacji może byćnarzędzie o nazwie Naptha.Naptha jest kompleksowym narzędziem OCR, które dla niepoznakiudaje rozszerzenie do Google Chrome. Pod względem jakościwykrywania i rozpoznawania tekstu dorównuje popularnymopensource'owym silnikom, choć oczywiście odstaje odzaawansowanych, komercyjnych aplikacji tego typu. W swoim zakresiezastosowań jest jednak wyjątkowe, dając internautom metodę nałatwe pozyskanie tekstu z praktycznie każdej grafiki.Zintegrowana z menu kontekstowym przeglądarki Naptha swojedziałanie rozpoczyna po zbliżeniu wskaźnika myszy do zawierającegointeresujący napis obrazka, rozpoczynając wówczas poszukiwaniawystępujących na nim bloków tekstu. Wykorzystuje w tym celualgorytm Strokewith Transform Microsoftu, obliczający dla każdego pikselaszerokość zawierającego go najbardziej prawdopodobnegopociągnięcia. Jako że fonty mają zwykle dość podobneszerokości, są w ten sposób łatwe do wychwycenia. Zastosowanieznanego ze specyfikacji HTML5 rozwiązania WebWorkers pozwala całyproces uruchomić w tle, nie zakłócając w ten sposób działaniasamej przeglądarki.[img=naptha]Po zaznaczeniu interesującego bloku tekstu i wybraniu opcji jegoskopiowania, zawierająca go bitmapa zostaje przesłana na serwer, naktórym działa OCR-owy silnik Ocrad. Po najdalej kilku sekundachotrzymujemy z powrotem przetworzony tekst, który można normalniewkleić, np. do dokumentu Worda czy LibreOffice. Jeśli to co zwróciłOcrad nas nie zadowala, można przełączyć w opcjach Napthy silnikna google'owego Tesseracta, który z niektórymi krojami fontówradzi sobie wyraźnie lepiej.Na tym możliwości tego ciekawego rozszerzenia się nie kończą.Z poziomu kontekstowego menu możemy wywołać mechanizm tłumaczenianapisów (obsługiwane są na razie angielski, hiszpański, rosyjski,niemiecki, francuski, chiński i japoński). Jeszcze ciekawsząfunkcją tego rozszerzenia jest usuwanie napisów z obrazków.Zaznaczając tekst na obrazku i wybierając z menu Translate opcjęErase uzyskujemy czystą, wolną od tekstu wersję, którą możnanp. skopiować do schowka. Mechanizm ten wykorzystuje algorytmypodobne do znanego z Photoshopa kontekstowego wypełniania i wwiększości wypadków przynosi dobre efekty.Więcej dowiecie się ze strony projektu – projectnaptha.com.Rozszerzenie na razie dostępne jest tylko na Chrome i chromopodobneprzeglądarki, głównie ze względu na problemy z implementacją WebWorkers dla Firefoksa. Musimy ostrzec, że ze względu na zależnośćnarzędzia od zewnętrznej usługi, może ono w każdej chwiliprzestać działać. Pomysł jednak jest na tyle innowacyjny, żemoże przyciągnąć innych programistów – może w końcu pojawisię wersja, która będzie korzystała z lokalnie uruchomionegosilnika OCR?

Obraz
Źródło artykułu: www.dobreprogramy.pl
Wybrane dla Ciebie
Windows 11 z nową aktualizacją. Poprawi m.in. Eksplorator plików
Windows 11 z nową aktualizacją. Poprawi m.in. Eksplorator plików
Linux 7.1 RC2 dostępny. Poprawki KVM i narzędzia AI
Linux 7.1 RC2 dostępny. Poprawki KVM i narzędzia AI
Ministerstwo Cyfryzacji: 355 mln zł na chmurę rządową i cyfrową tożsamość
Ministerstwo Cyfryzacji: 355 mln zł na chmurę rządową i cyfrową tożsamość
Microsoft usuwa pasek boczny z Edge'a. Copilot zostaje
Microsoft usuwa pasek boczny z Edge'a. Copilot zostaje
Windows 10 u co czwartego gracza. Nowe dane Steam
Windows 10 u co czwartego gracza. Nowe dane Steam
Wiadomość o nadpłacie za gaz. Podszywają się pod Orlen
Wiadomość o nadpłacie za gaz. Podszywają się pod Orlen
Zapowiedź zmian w mObywatelu. Rewolucja dla kierowców
Zapowiedź zmian w mObywatelu. Rewolucja dla kierowców
Odpalił Dooma w... chatbocie. Ty też możesz
Odpalił Dooma w... chatbocie. Ty też możesz
YouTube włącza PIP dla wszystkich użytkowników
YouTube włącza PIP dla wszystkich użytkowników
Kabel USB-C: co sprawdzić przed zakupem?
Kabel USB-C: co sprawdzić przed zakupem?
Aktualizacja KSeF 2.0. Pozwala zgłaszać fałszywe faktury
Aktualizacja KSeF 2.0. Pozwala zgłaszać fałszywe faktury
Nowość w Uberze. Rośnie konkurencja dla Booking
Nowość w Uberze. Rośnie konkurencja dla Booking
ZANIM WYJDZIESZ... NIE PRZEGAP TEGO, CO CZYTAJĄ INNI!