Oto, jak można w sprytny sposób odczytać rozpikselowany tekst

Oto, jak można w sprytny sposób odczytać rozpikselowany tekst08.12.2020 06:29

Gdzie człowiek nie może, tam pośle algorytm. Tak oto pikselizacja tekstu jako efektywne zabezpieczenie przed oczytaniem odchodzi właśnie do lamusa.

Pikselizacja, czyli deformacja obrazu rastrowego poprzez widoczne obniżenie szczegółowości, to powszechnie znane narzędzie cenzury. Zwłaszcza w epoce internetu, gdy publikuje się w formacie cyfrowym cały szereg dokumentów wymagających częściowego ukrycia przedstawionych informacji. Ot, choćby danych osobowych.

Jak działa? Obraz wyświetlany na ekranie składa się z milionów pikseli, przez co należy rozumieć najmniejsze i niepodzielne składowe. W wyniku pikselizacji kolor pikseli w obrębie ich kolejnych skupisk zostaje uśredniony, co przy odpowiednio rzadkim rozmieszczeniu tychże skupisk uniemożliwia odczytanie treści. To proste, a wręcz prymitywne rozwiązanie. Ale skoro skuteczne, nie było przecież sensu nad nim debatować.

fot. LinkedIn (Sipke Mellema)
fot. LinkedIn (Sipke Mellema)

Efekt pikselizacji jako narzędzie cenzury ma jednakowoż oczywistą wadę: jest powtarzalny. Jeśli użyjemy klasycznego filtra liniowego i tych samych nastaw precyzji, to dana czcionka w konkretnym rozmiarze i kolorze zawsze zostanie zdeformowana w ten sam sposób.

Nie stanowi to problemu, gdy rozmazany zostaje cały dokument, ale już w przypadku pojedynczych słów sprawy się mają inaczej. Potencjalny napastnik jest bowiem w stanie rozpoznać charakterystykę czcionki. I na ten właśnie aspekt uwagę zwrócił programista Sipke Mellema, który przygotował narzędzie do odczytywania rozpikselowanego tekstu.

fot. LinkedIn (Sipke Mellema)
fot. LinkedIn (Sipke Mellema)

Depix, jak nazwano program, został stworzony w Pythonie i stanowi rodzaj algorytmu porównywania. Z jednej strony przyjmuje zamazany dokument, z drugiej zaś – próbkę oczekiwanej czcionki przedstawionej poprzez cykl de Bruijna. Analizując kolejne grupy pikseli, szuka zgodności pomiędzy stylem rozmycia, a tym jak ewentualnie wyglądałyby kombinacje dwuliterowe po rozmyciu w pliku źródłowym. Ostatecznie zwraca czytelny tekst.

Oczywiście takie rozwiązanie ma swoje niedoskonałości, i to liczne. Nie zadziała na niejednolitych tłach ani w przypadku innych niż pikselizacja rodzajów deformacji, np. rozmycia za pomocą filtru Gaussa. Tak czy inaczej, stanowi pewien postęp w dziedzinie technik OSINT. Więcej informacji o Depiksie, jak również sam program znajdziecie na GitHubie.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.