Otwarty OCR od Google Strona główna Aktualności06.09.2006 11:11 Udostępnij: O autorze msliwa Właściciel najpopularniejszej wyszukiwarki poinformował niedawno o otwarciu kodu źródłowego silnika do optycznego rozpoznawania znaków (OCR) - Tesseract, stworzonego w laboratoriach firmy Hewlett Packard. System był tworzony w latach 1985 - 1995, wtedy znalazł się w pierwszej trójce konkursu zorganizowanego przez Uniwersytet Nevada w Las Vegas. Niestety, krótko po tym, firma HP zrezygnowała z inwestycji w tą technologię, od tego czasu aplikacja nie była rozwijana. Rok temu, grupa pracowników firmy stwierdziła, że szkoda byłoby, żeby cały nakład pracy włożony w jej rozwój poszedł na marne i postanowiono o otwarciu źródeł. Pracę nad projektem przejął instytut zajmujący się technologiami informacyjnymi na Uniwersytecie Nevada, któremu aktywnie pomaga firma Google. Poprawiono najważniejsze błędy, a w czerwcu tego roku zdecydowano o opublikowaniu źródeł. Tesseract obsługuje aktualnie tylko język angielski, nie potrafi jeszcze analizować układu strony, słabo radzi sobie z wielokolumnowym tekstem. Pomijając te niedociągnięcia, Tesseract osiąga najlepsze wyniki odczytu tekstu wśród otwartych narzędzi do OCR. Więcej informacji o projekcie na stronie domowej w serwisie SourceForge.net. Udostępnij: © dobreprogramy Zgłoś błąd w publikacji Zobacz także Chrome na Androida – niewielka zmiana ułatwi zamykanie wszystkich otwartych kart 13 gru 2018 Mateusz Budzeń Oprogramowanie 4 Asystent Google po polsku ruszy w 2019 roku? Google zaprasza na spotkanie w połowie stycznia 18 gru 2018 Oskar Ziomek Oprogramowanie SmartDom 27 Google zamknie platformę społecznościową Google+. Przyczyną luki w zabezpieczeniach 13 gru 2018 Anna Rymsza Internet Bezpieczeństwo 32 Google blokuje otwarty sterownik dla kart NVIDII pod Linuksem, twórcy zapowiadają walkę 6 sty Piotr Urbaniak Oprogramowanie Internet 139
Udostępnij: O autorze msliwa Właściciel najpopularniejszej wyszukiwarki poinformował niedawno o otwarciu kodu źródłowego silnika do optycznego rozpoznawania znaków (OCR) - Tesseract, stworzonego w laboratoriach firmy Hewlett Packard. System był tworzony w latach 1985 - 1995, wtedy znalazł się w pierwszej trójce konkursu zorganizowanego przez Uniwersytet Nevada w Las Vegas. Niestety, krótko po tym, firma HP zrezygnowała z inwestycji w tą technologię, od tego czasu aplikacja nie była rozwijana. Rok temu, grupa pracowników firmy stwierdziła, że szkoda byłoby, żeby cały nakład pracy włożony w jej rozwój poszedł na marne i postanowiono o otwarciu źródeł. Pracę nad projektem przejął instytut zajmujący się technologiami informacyjnymi na Uniwersytecie Nevada, któremu aktywnie pomaga firma Google. Poprawiono najważniejsze błędy, a w czerwcu tego roku zdecydowano o opublikowaniu źródeł. Tesseract obsługuje aktualnie tylko język angielski, nie potrafi jeszcze analizować układu strony, słabo radzi sobie z wielokolumnowym tekstem. Pomijając te niedociągnięcia, Tesseract osiąga najlepsze wyniki odczytu tekstu wśród otwartych narzędzi do OCR. Więcej informacji o projekcie na stronie domowej w serwisie SourceForge.net. Udostępnij: © dobreprogramy Zgłoś błąd w publikacji