r   e   k   l   a   m   a
r   e   k   l   a   m   a

Sieci neuronowe Google'a skuteczniejsze niż ludzie, nie dały testowi reCAPTCHA żadnych szans

Strona główna AktualnościOPROGRAMOWANIE

O google'owych testach reCAPTCHA zrobiło się u nas ostatnio ponownie głośno, gdy Aero2 wykorzystało je do zablokowania automatycznych uwierzytelnień do swojej usługi dostępu do Internetu. Jednym z argumentów na rzecz reCAPTCHA przytaczanych przez Aero2 było bezpieczeństwo tego rozwiązania. Okazuje się jednak, że aż tak bezpieczne reCAPTCHA nie jest, nawet dla samego Google'a. Wyszukiwarkowy gigant sam pochwalił się nowym algorytmem, który przechodzi test reCAPTCHA w 99,8% wypadków. Czy czeka nas teraz dalsza eskalacja utrudnień?

Rozwiązywanie testu reCAPTCHA nie było wcale zadaniem zespołu informatyków Google'a, którzy opublikowali właśnie pracę pt. Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks. Ich zadaniem było ulepszenie algorytmów wykorzystywanych do obróbki fotografii z usługi Street View, by pozyskiwać z nich numery budynków, potrzebne do budowania baz adresowych dla Map Google.

To nie jest łatwy problem: liczba możliwych wariacji w wyglądzie napisów, ich orientacji, kolorze, stylizacji, tle i oświetleniu jest ogromna. Standardowe skanery OCR, zajmujące się przetwarzaniem obrazów wydrukowanego tekstu na ciągi tekstowe słabo sobie z nim radzą. Zaproponowane przez badaczy Google'a rozwiązanie wykorzystywało techniki trenowania dużych, rozproszonych, zawiłych sieci neuronowych na obrazach o wysokiej jakości. Architektura takich sieci jest bezpośrednio inspirowana układem komórek w korze wzrokowej wyższych kręgowców. W tym konkretnym wypadku wykorzystano software'owy system DistBelief, pozwalający na wykorzystanie klastrów obliczeniowych z tysiącami maszyn i dziesiątkami tysięcy rdzeni CPU.

r   e   k   l   a   m   a

Zastosowanie DistBelief na publicznie dostępnym zbiorze Street View House Numbers (SVHN) pozwoliło na ponad 96-procentową dokładność w rozpoznawaniu ulicznej numeracji. Wobec znacznie trudniejszego zbioru danych ze Street View, obejmującego dziesiątki milionów zdjęć ulic z całego świata, skuteczność wyniosła około 90%. To wyniki porównywalne z możliwościami ludzkich operatorów, nic więc dziwnego, że w tak zautomatyzowany sposób wydobyto ze zdjęć ponad 100 milionów ulicznych numerów.

DistBelief nadaje się jednak nie tylko do analizy fotografii. Sprawdzono jego możliwości względem testu reCAPTCHA, wykorzystywanego na setkach tysięcy stron internetowych do odróżniania ludzi od botów i ochrony przed spamem. Zawiła sieć neuronowa nie dała testowi żadnych szans, rozwiązując nawet najtrudniejsze formy reCAPTCHA ze skutecznością na poziomie 99,8%. To wynik daleko lepszy, niż w wypadku ludzi, mających w tych czasach coraz większe problemy z rozpoznawaniem niemożliwie wręcz deformowanych napisów.

Czy to osiągnięcie podważa wartość testu? Zdaniem Google'a niekoniecznie, gdyż dziś reCAPTCHA jest mniej zależna od poprawnego odczytania tekstu, niż kiedykolwiek wcześniej, zamiast tego analizując szerszy zbiór wskazówek wynikających z aktywności użytkownika. Wpisanie tekstu jest tylko jedną z nich.

Niebawem powinno okazać się, na ile twórcy systemów do automatycznego przechodzenia testów CAPTCHA będą podzielali tę opinię. Zmniejszenie wagi poprawnego odczytania testu jako kluczowego dowodu „człowieczeństwa” może paradoksalnie doprowadzić teraz do dalszego utrudnienia życia internautom, którzy zaczną odkrywać, że nawet poprawne odczytanie zagmatwanego napisu nie jest gwarancją poprawnego przejścia testu, gdyż np. interwały między naciśnięciami klawiszy nie były takie jak trzeba.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.