Nagłówki TCP/IP wystarczą, by sprawdzić co oglądasz na Netfliksie

Nagłówki TCP/IP wystarczą, by sprawdzić co oglądasz na Netfliksie

Nagłówki TCP/IP wystarczą, by sprawdzić co oglądasz na Netfliksie
Oskar Ziomek
12.04.2017 21:14, aktualizacja: 13.04.2017 10:36

Podczas oglądania filmów przez Netflixa, do strumieniowania materiału wideo wykorzystujemy od pewnego czasu protokół HTTPS. Choć teoretycznie powinien być wystarczający, aby zapewnić widzom pewien stopień prywatności, okazuje się, że nie jest przeszkodą w zdobyciu informacji o tym, co w danej chwili ogląda konkretny użytkownik, a wystarczy do tego analiza nagłówków TCP/IP.

Do takich wniosków doszli badacze z United States Military Academy w West Point, którzy w opublikowanych niedawno badaniach opisują, jak można tego dokonać. Całość opiera się o analizę wspomnianych nagłówków i porównywanie ich z utworzoną uprzednio bazą pozwalającą identyfikować konkretne filmy. Co ciekawe, obliczenia nie wymagają zaprzęgania do pracy wyjątkowo wydajnego sprzętu.

Na potrzeby przeprowadzanej analizy, badacze stworzyli oprogramowanie indeksujące, które przeanalizowało filmy zamieszczone w Netflixie. W efekcie uzyskano bazę ponad 330 tysięcy „odcisków” (ang. fingerprints), zawierających w sobie zakodowaną informację o cechach szczególnych nagrań. Dotyczyły one łącznie 42 tys. filmów (zatem na każde nagranie przypadło średnio ponad 7 próbek). Na koniec została jeszcze konfiguracja bazy oraz stworzenie oprogramowania dla serwera oraz klienta na potrzeby testów.

Te polegały na odtworzeniu 100 losowo wybranych nagrań z Netflixa na każdym z dwóch komputerów oraz analizie generowanego w ten sposób ruchu sieciowego. Każde nagranie przełączane było na kolejne po upływie około 20 minut. Jak się okazuje, był to wystarczający czas, aby w 199 z 200 powyższych przypadków, filmy zostały rozpoznane prawidłowo. Co więcej, ponad połowa z nich została właściwie zidentyfikowana w czasie krótszym, niż 2 i pół minuty.

Prawdopodobieństwo poprawnego zidentyfikowania filmu rośnie wraz z czasem jego oglądania
Prawdopodobieństwo poprawnego zidentyfikowania filmu rośnie wraz z czasem jego oglądania

Z danych wynika również, iż najdłuższa analiza trwała tylko nieco ponad 12 minut. Można więc założyć, że w praktyce możliwe byłoby zidentyfikowanie każdego serialu czy filmu odtwarzanego na Netfliksie, o ile użytkownik celowo nie ogląda tylko „co trzeciej sceny”, przewijając nagranie.

Na koniec warto dodać, iż celem badaczy nie było wykrycie błędów programistów Netfliksa, ale zwrócenie uwagi na fakt, iż wykorzystanie HTTPS nie jest jednoznaczną gwarancją na całkowite bezpieczeństwo w Sieci, przynajmniej jeśli mowa o strumieniowaniu wideo z wykorzystaniem TCP/IP. Zainteresowanych szczegółami powinny zaciekawić repozytoria na GitHubie, gdzie zamieszczono kod aplikacji wykorzystanych podczas opisywanych tu badań.

Programy

Zobacz więcej
Źródło artykułu:www.dobreprogramy.pl
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (10)