r   e   k   l   a   m   a
r   e   k   l   a   m   a

Google przeszukuje skany

Strona główna Aktualności

W wyszukiwarce Google dodano możliwość przeszukiwania plików PDF, które zawierają skany papierowych dokumentów.

Wykorzystywana jest do tego otwarta technologia OCRopus bazująca na oprogramowaniu Tesseract stworzonym przez HP. Google próbowało ją wykorzystać już rok temu, jednak było sporo problemów z małymi czcionkami oraz szeryfowymi. Zatrudniono jednak inżynierów, którzy pracowali nad rozwiązaniem tego problemu. Jak to działa obecnie można się przekonać szukając takich fraz jak repairing aluminum wiring czy spin lock performance. Wybierając podgląd jako HTML można przekonać się, że faktycznie skany zostały rozpoznane jako tekst i np. zaznaczyć go i skopiować. Minusem jest tylko to, że gubione są rysunki, zachowywany jest jednak tekst w nich umieszczony.

r   e   k   l   a   m   a
© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.