Błędne koło AI. Eksperci mówią o upadających modelach

Modele AI trenowane na podstawie danych wygenerowanych przez sztuczną inteligencję mogą upadać. Naukowcy podkreślają, że jakość informacji, które podaje się modelom, jest kluczowa dla ich funkcjonowania.

Sztuczna inteligencja zmienia wszystkie dziedziny życiaSztuczna inteligencja zmienia wszystkie dziedziny życia
Źródło zdjęć: © Licencjodawca

W artykule opublikowanym w prestiżowym czasopiśmie naukowym "Nature", naukowcy dowodzą, że modele sztucznej inteligencji (AI) mogą doświadczać tzw. "upadku modelu" (model collapse), kiedy są trenowane na danych generowanych przez inne modele AI. Zwracają oni uwagę na konieczność korzystania z wiarygodnych, rzetelnych danych podczas procesu trenowania modeli AI, aby zapewnić ich prawidłowe funkcjonowanie.

Podstawą ich argumentacji jest koncepcja "upadku modelu", która odnosi się do sytuacji, gdy modele AI są trenowane na zestawach danych generowanych przez inne modele AI. Naukowcy twierdzą, że taki proces może prowadzić do "zanieczyszczenia" wyników, co oznacza, że oryginalna treść danych jest zastępowana niepowiązanymi ze sobą nonsensami. W efekcie, po kilku generacjach, modele AI mogą zacząć generować treści, które nie mają żadnego sensu.

Dalsza część artykułu pod materiałem wideo

Naukowcy zwracają uwagę na narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), które zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednak, jak dowodzą badacze, w miarę rozprzestrzeniania się tych modeli AI w internecie, istnieje ryzyko, że treści generowane komputerowo mogą być używane do trenowania innych modeli AI, a nawet samego siebie. Taki proces określa się mianem pętli rekurencyjnej.

Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego zespół, korzystając z modeli matematycznych, zilustrowali, jak modele AI mogą doświadczać "upadku". Wykazali, że AI może pomijać pewne wyniki (np. mniej powszechne fragmenty tekstu) w danych treningowych, co prowadzi do sytuacji, gdy trening odbywa się tylko na części zestawu danych.

Upadające modele AI

Badacze przeprowadzili również analizę, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI prowadzi do degradacji kolejnych generacji modeli pod względem zdolności do uczenia się, co ostatecznie prowadzi do "upadku modelu".

Wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Jako przykład, naukowcy podali test, w którym do treningu wykorzystano tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, generowała treści dotyczące zajęcy.

Autorzy badania podkreślają, że "upadek modelu" jest nieunikniony, jeśli do treningu AI będą używane zestawy danych generowanych przez poprzednie generacje modeli. Twierdzą, że skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach jest możliwe, ale wymaga starannego filtrowania wygenerowanych danych. Dodatkowo, naukowcy zaznaczają, że firmy technologiczne, które zdecydują się na wykorzystanie do trenowania AI wyłącznie treści generowanych przez ludzi, mogą zyskać przewagę konkurencyjną.

Źródło artykułu:
Wybrane dla Ciebie
Wyciek danych klientów polskich sklepów. 130 tys. pokrzywdzonych
Wyciek danych klientów polskich sklepów. 130 tys. pokrzywdzonych
mBank zmienia wymagania aplikacji. Niektórzy muszą wymienić telefon
mBank zmienia wymagania aplikacji. Niektórzy muszą wymienić telefon
Awaria w Pekao S.A. Problem z bankowością (aktualizacja)
Awaria w Pekao S.A. Problem z bankowością (aktualizacja)
Zakazy social mediów dla nastolatków. Eksperci widzą problem
Zakazy social mediów dla nastolatków. Eksperci widzą problem
Zagrożenia w sieci. Na nie narażone są dzieci
Zagrożenia w sieci. Na nie narażone są dzieci
Sextortion: na czym polega internetowy szantaż?
Sextortion: na czym polega internetowy szantaż?
Koniec dominacji USA w Europie? Francja porzuca Windowsa
Koniec dominacji USA w Europie? Francja porzuca Windowsa
Ministerstwo Cyfryzacji zachwala mSzyfr. Nowy, bezpieczny komunikator
Ministerstwo Cyfryzacji zachwala mSzyfr. Nowy, bezpieczny komunikator
Zapłacą 99 mln dol. Pozwolą naprawić ciągniki bez oficjalnego serwisu
Zapłacą 99 mln dol. Pozwolą naprawić ciągniki bez oficjalnego serwisu
Komunikat Pekao S.A. Dotyczy wszystkich klientów
Komunikat Pekao S.A. Dotyczy wszystkich klientów
Copilot znika. Microsoft wycofuje się z agresywnej promocji
Copilot znika. Microsoft wycofuje się z agresywnej promocji
Santander Bank Polska zmienia nazwę. Będzie nowy adres WWW
Santander Bank Polska zmienia nazwę. Będzie nowy adres WWW
ZATRZYMAJ SIĘ NA CHWILĘ… TE ARTYKUŁY WARTO PRZECZYTAĆ 👀