GitHub Copilot: sztuczna inteligencja a prawa autorskie

GitHub Copilot: sztuczna inteligencja a prawa autorskie11.07.2021 07:30
GitHub Copilot: sztuczna inteligencja a prawa autorskie
Źródło zdjęć: © Pixabay | chenspec

GitHub niedawno opublikował narzędzie Copilot: wspomagany sztuczną inteligencją kreator kodu źródłowego. Na podstawie napisanego już kodu oraz modelu GPT-3, narzędzie sugeruje "ciąg dalszy". Okazało się, że ten eksperymentalny projekt stał się wielkim newsem w pewnych kręgach IT. Mnóstwo razy padło pytanie "czy Copilot zastąpi programistów?". Pytanie brzmi atrakcyjnie, ale jest chybione.

Jasnym powinno być, że zawód programisty jest całkowicie niezagrożony przez Copilota w jego obecnym kształcie. Wśród tuzinów wytłumaczeń, najprostszym z nich jest entropia: model nie jest na tyle "mądry" by zwiększać poziom swojej kreatywności. Model GPT-3 jest uczony na podstawie już powstałego kodu. Jeżeli zacznie się go "karmić" kodem stworzonym przez siebie, stanie się metastabilny. Innymi słowy, będzie tworzyć unikatowe dzieła, ale nie będzie się rozwijać.

Uczenie maszynowe

O wiele ciekawsze pytanie na temat zagrożeń związanych z GPT-3 postawiła Nora Tindall. Postanowiła się dowiedzieć, jaki był wejściowy zestaw danych do stworzenia modelu na którym operuje GitHub Copilot. Rozwój GPT-3 jest bowiem niejawny. Wyłączne prawa do jego użycia ma obecnie Microsoft, właściciel zarówno GitHuba, jak i jedynej licencji na kod źródłowy narzędzia. Niech obecność na GitHubie nikogo nie zmyli: GPT-3 nie jest oprogramowaniem open source.

Tindall otrzymała odpowiedź od GitHuba (wskazującą, że pierwsza linia wsparcia albo nie rozumiała początkowych dociekań, albo celowo utrudniała dostęp do stanu faktycznego). Otóż Microsoft do trenowania GPT-3 dla Copilota użył… całego dostępnego publicznie kodu hostowanego na GitHubie. Niezależnie od jego licencji. A przecież to, że kod jest publiczny nie znaczy jeszcze, że jego użycie nie podlega żadnym ograniczeniom. Co więcej, GitHub hostuje sporo kodu, który znajduje się na nim nielegalnie, jak źródła systemu Windows NT 4.0.

Maszyna vs człowiek

Stosowanym tutaj, pośrednio, wytłumaczeniem takiej decyzji jest powołanie się na koncepcję uczenia. Wszak człowiek, czytając kod źródłowy (w tym ten o ograniczonym prawie do wykorzystania), uczy się. Nie znaczy to, że wykorzysta poznany kod bezpośrednio. Inspiracja owym kodem nie musi być nawet szczególnie silna. Jest to problem dobrze znany zawodowym programistom. Kod z poprzedniego miejsca pracy, pokryty NDA, nie jest używany w nowych projektach, ale doświadczenie wykształcone wskutek jego tworzenia, niewątpliwie na wpływ na kształt nowych tworów. Skoro więc w taki sposób uczy się człowiek, dlaczego nie można na to pozwolić maszynie?

Copilot być może nie nadaje się jeszcze do pair programmingu, ale może być pomocny z innych powodów, Źródło zdjęć: © dobreprogramy | Kamil J. Dudek
Copilot być może nie nadaje się jeszcze do pair programmingu, ale może być pomocny z innych powodów
Źródło zdjęć: © dobreprogramy | Kamil J. Dudek

Takie wykorzystanie największej publicznej bazy kodu źródłowego jest jednak, w opinii Nory Tindall, rażącym naruszeniem praw autorskich. Maszyna nie "uczy się" w taki sam sposób jak człowiek, a GPT-3 nie "rozumie" kodu, który przetwarza. Zaciągnięcie całej bazy GitHuba jest więc nieuprawnionym wykorzystaniem kodu w celu oferowania komercyjnej usługi przez prywatną firmę.

Prawa autorskie

Implikacje tego stanu rzeczy są poważne. Przede wszystkim, pokazują że prawa autorskie dotyczą "zwykłych śmiertelników", ale nie wielkich firm (chyba, że chodzi o konkurentów). Działający w pojedynkę użytkownik zmierzy się z armią prawników jeżeli wyjdzie na jaw, że w nieuprawniony sposób wykorzystał kod źródłowy należący do korporacji. Ale gdy to korporacje użyją literalnie całego istniejącego w internecie kodu, są bezkarne. Bowiem nawet, gdy w przyszłości zostanie uznane, drogą sądową, że działanie to było bezprawne, Copilot już powstał i działał.

"Open" to pojęcie względne...
"Open" to pojęcie względne...

Istnieje też zagrożenie o wiele bardziej hipotetyczne, dotyczy bowiem potencjalnej przyszłości (technologia czyniąca je możliwym jeszcze nie istnieje). Operatorzy sztucznej inteligencji będą mieli nieskończoną przewagę na ludzkimi programistami, a miara przewagi między samymi operatorami będzie ściśle zależna od ich rozmiaru. Wielcy staną się jeszcze więksi, mali znikną z branży.

Co gorsza, jest to wydarzenie bez precedensu. Nie mamy opracowanych obyczajów ani ram etycznych, kodyfikujących niniejsze zagadnienie. Licencje hostowanego oprogramowania są niedostosowane do ochrony przed wykorzystaniem w taki sposób. Tindall zwróciła się o pomoc do fundacji FSF i EFF.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.