r   e   k   l   a   m   a
r   e   k   l   a   m   a

macOS z błędami w obsłudze PDF, może uszkodzić pliki z tekstem po polsku

Strona główna AktualnościOPROGRAMOWANIE

We wrześniu pojawiły się pierwsze doniesienia o poważnych problemach systemu macOS 10.12 w obsłudze plików PDF. Dotyczyły one błędów wywoływanych przez edycję pliku w Preview, domyślnym programie obsługującym PDF-y w macOS-ie. Próby kończyły się całkowitym usunięciem warstwy obrazu przetworzonego na tekst. Wówczas jednak uważano, że dotyczy to jedynie użytkowników skanerów Fujitsu ScanSnap. Dziś wiadomo, że błędy w systemie Apple są znacznie poważniejsze i mają większy zasięg.

Sprawie wnikliwie przyjrzał się Adam Engst z TidBITS. Przeanalizował on wiele zgłoszeń dotyczących błędów w obsłudze PDF. Dotyczyły one przede wszystkim obsługi OCR czyli oprogramowania analizującego pliki PDF i przetwarzającego tekst z obrazów (np. skanów) do tekstu. Problemy są na tyle poważne, że w tej chwili odradza on korzystanie z programu Preview do obsługi PDF-ów, gdyż może to poskutkować całkowitym usunięciem warstwy OCR, a nawet uszkodzeniem plików.

Twórcy oprogramowania OCR (między innymi EagleFiler, DEVONthink czy DocumentSnap – nie można już zatem mówić o pojedynczych przypadkach) jednogłośnie wskazują na winę Apple. Korporacja w systemie macOS 10.12 zdecydowała się na implementację nowej wersji PDFKit, która wchodzi w konflikty z oprogramowaniem firm trzecich dostępnym w App Store i powoduje między innymi usuwanie warstwy OCR po edycji pliku w Preview. Bez ogródek sprawę komentuje Christian Grunenberg z DEVONthink:

r   e   k   l   a   m   a
Apple chce używać wspólnej bazy dla macOS-a i iOS-a. Niemniej zostało to udostępnione zdecydowanie zbyt wcześnie, i po raz pierwszy (przynajmniej w mojej karierze) Apple porzuciło funkcje nie martwiąc się o kompatybilność.

Kwestia dotyczy nie tylko przetworzonego na tekstu obrazu, ale także warstwy komentarzy. Na forum deweloperskim założono już odpowiedni wątek, jednak wygląda na to, że na rozwiązanie problemu trzeba będzie poczekać do kolejnej aktualizacji Sierry. Pozostaje także mieć nadzieję, że Apple potraktuje sprawę poważniej, niż we wrześniu, kiedy załatano tylko błędy kompatybilności ze ScanSnap.

Problem jest tym poważniejszy, że dotyczy także polskich użytkowników. Engst zwraca uwagę, że błędy w PDFKit dotyczą także przetwarzania środkowoeuropejskich znaków diakrytycznych. W przypadku dokumentów przetworzonych wczesniej przez ABBYY FineReader 8, pliki zawierające „polskie znaki” zostaną uszkodzone po edycji w Preview. Zalecamy zatem wstrzymanie się od ich modyfikowanie dzięki systemowym narzędziom Apple aż do publikacji łatki.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.