Sieci neuronowe Google'a skuteczniejsze niż ludzie, nie dały testowi reCAPTCHA żadnych szans

Sieci neuronowe Google'a skuteczniejsze niż ludzie, nie dały testowi reCAPTCHA żadnych szans17.04.2014 14:47

O google'owych testach reCAPTCHA zrobiło się u nas ostatnioponownie głośno, gdy Aero2 wykorzystało je do zablokowaniaautomatycznych uwierzytelnień do swojej usługi dostępu doInternetu. Jednym z argumentów na rzecz reCAPTCHA przytaczanychprzez Aero2 było bezpieczeństwo tego rozwiązania.Okazuje się jednak, że aż tak bezpieczne reCAPTCHA nie jest, nawetdla samego Google'a. Wyszukiwarkowy gigant sam pochwalił się nowymalgorytmem, który przechodzi test reCAPTCHA w 99,8% wypadków. Czyczeka nas teraz dalsza eskalacja utrudnień?

Rozwiązywanie testu reCAPTCHAnie było wcale zadaniem zespołu informatyków Google'a, którzyopublikowali właśnie pracępt. Multi-digit Number Recognition from Street View Imageryusing Deep Convolutional Neural Networks.Ich zadaniem było ulepszenie algorytmów wykorzystywanych do obróbkifotografii z usługi Street View, by pozyskiwać z nich numerybudynków, potrzebne do budowania baz adresowych dla Map Google.

Sieć neuronowa DistBelief nie ma problemu z takimi testami
Sieć neuronowa DistBelief nie ma problemu z takimi testami

To nie jest łatwy problem:liczba możliwych wariacji w wyglądzie napisów, ich orientacji,kolorze, stylizacji, tle i oświetleniu jest ogromna. Standardoweskanery OCR, zajmujące się przetwarzaniem obrazów wydrukowanegotekstu na ciągi tekstowe słabo sobie z nim radzą. Zaproponowaneprzez badaczy Google'a rozwiązanie wykorzystywało technikitrenowania dużych, rozproszonych, zawiłychsieci neuronowych na obrazach o wysokiej jakości. Architekturatakich sieci jest bezpośrednio inspirowana układem komórek w korzewzrokowej wyższych kręgowców. W tym konkretnym wypadkuwykorzystano software'owy system DistBelief,pozwalający na wykorzystanie klastrów obliczeniowych z tysiącamimaszyn i dziesiątkami tysięcy rdzeni CPU.

Zastosowanie DistBelief napublicznie dostępnym zbiorze Street View House Numbers (SVHN)pozwoliło na ponad 96-procentową dokładność w rozpoznawaniuulicznej numeracji. Wobec znacznie trudniejszego zbioru danych zeStreet View, obejmującego dziesiątki milionów zdjęć ulic zcałego świata, skuteczność wyniosła około 90%. To wynikiporównywalne z możliwościami ludzkich operatorów, nic więcdziwnego, że w tak zautomatyzowany sposób wydobyto ze zdjęć ponad100 milionów ulicznych numerów.

DistBelief nadaje się jednak nietylko do analizy fotografii. Sprawdzono jego możliwości względemtestu reCAPTCHA, wykorzystywanego na setkach tysięcy stroninternetowych do odróżniania ludzi od botów i ochrony przedspamem. Zawiła sieć neuronowa nie dała testowi żadnych szans,rozwiązując nawet najtrudniejsze formy reCAPTCHA ze skutecznościąna poziomie 99,8%. To wynik daleko lepszy, niż w wypadku ludzi,mających w tych czasach coraz większe problemy z rozpoznawaniemniemożliwie wręcz deformowanych napisów.

Czy to osiągnięcie podważawartość testu? Zdaniem Google'a niekoniecznie, gdyż dziśreCAPTCHA jest mniej zależna od poprawnego odczytania tekstu, niżkiedykolwiek wcześniej, zamiast tego analizując szerszy zbiórwskazówek wynikających z aktywności użytkownika. Wpisanie tekstujest tylko jedną z nich.

Niebawem powinno okazać się, naile twórcy systemów do automatycznego przechodzenia testów CAPTCHAbędą podzielali tę opinię. Zmniejszenie wagi poprawnegoodczytania testu jako kluczowego dowodu „człowieczeństwa” możeparadoksalnie doprowadzić teraz do dalszego utrudnienia życiainternautom, którzy zaczną odkrywać, że nawet poprawne odczytaniezagmatwanego napisu nie jest gwarancją poprawnego przejścia testu,gdyż np. interwały między naciśnięciami klawiszy nie były takiejak trzeba.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.