Otwarty OCR od Google Strona główna Aktualności06.09.2006 11:11 Udostępnij: O autorze msliwa Właściciel najpopularniejszej wyszukiwarki poinformował niedawno o otwarciu kodu źródłowego silnika do optycznego rozpoznawania znaków (OCR) - Tesseract, stworzonego w laboratoriach firmy Hewlett Packard. System był tworzony w latach 1985 - 1995, wtedy znalazł się w pierwszej trójce konkursu zorganizowanego przez Uniwersytet Nevada w Las Vegas. Niestety, krótko po tym, firma HP zrezygnowała z inwestycji w tą technologię, od tego czasu aplikacja nie była rozwijana. Rok temu, grupa pracowników firmy stwierdziła, że szkoda byłoby, żeby cały nakład pracy włożony w jej rozwój poszedł na marne i postanowiono o otwarciu źródeł. Pracę nad projektem przejął instytut zajmujący się technologiami informacyjnymi na Uniwersytecie Nevada, któremu aktywnie pomaga firma Google. Poprawiono najważniejsze błędy, a w czerwcu tego roku zdecydowano o opublikowaniu źródeł. Tesseract obsługuje aktualnie tylko język angielski, nie potrafi jeszcze analizować układu strony, słabo radzi sobie z wielokolumnowym tekstem. Pomijając te niedociągnięcia, Tesseract osiąga najlepsze wyniki odczytu tekstu wśród otwartych narzędzi do OCR. Więcej informacji o projekcie na stronie domowej w serwisie SourceForge.net. Udostępnij: © dobreprogramy Zgłoś błąd w publikacji Zobacz także Google Meet od teraz za darmo dla każdego. Rywalizacja z Zoomem się rozkręca 29 kwi 2020 Jakub Krawczyński Oprogramowanie Internet 49 Błędna konfiguracja chmury to otwarta droga dla hakerów 8 cze 2020 Materiał prasowy Internet Bezpieczeństwo 1 Google tnie koszty przez koronawirusa i porównuje problemy do kryzysu z 2008 roku 16 kwi 2020 Oskar Ziomek Biznes Koronawirus 16 Mapy Google i inne nawigacje mają problem. Niemcy zakazują ostrzeżeń o fotoradarach 26 kwi 2020 Oskar Ziomek Oprogramowanie Bezpieczeństwo TechMoto 394
Udostępnij: O autorze msliwa Właściciel najpopularniejszej wyszukiwarki poinformował niedawno o otwarciu kodu źródłowego silnika do optycznego rozpoznawania znaków (OCR) - Tesseract, stworzonego w laboratoriach firmy Hewlett Packard. System był tworzony w latach 1985 - 1995, wtedy znalazł się w pierwszej trójce konkursu zorganizowanego przez Uniwersytet Nevada w Las Vegas. Niestety, krótko po tym, firma HP zrezygnowała z inwestycji w tą technologię, od tego czasu aplikacja nie była rozwijana. Rok temu, grupa pracowników firmy stwierdziła, że szkoda byłoby, żeby cały nakład pracy włożony w jej rozwój poszedł na marne i postanowiono o otwarciu źródeł. Pracę nad projektem przejął instytut zajmujący się technologiami informacyjnymi na Uniwersytecie Nevada, któremu aktywnie pomaga firma Google. Poprawiono najważniejsze błędy, a w czerwcu tego roku zdecydowano o opublikowaniu źródeł. Tesseract obsługuje aktualnie tylko język angielski, nie potrafi jeszcze analizować układu strony, słabo radzi sobie z wielokolumnowym tekstem. Pomijając te niedociągnięcia, Tesseract osiąga najlepsze wyniki odczytu tekstu wśród otwartych narzędzi do OCR. Więcej informacji o projekcie na stronie domowej w serwisie SourceForge.net. Udostępnij: © dobreprogramy Zgłoś błąd w publikacji