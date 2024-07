Podstawą ich argumentacji jest koncepcja "upadku modelu", która odnosi się do sytuacji, gdy modele AI są trenowane na zestawach danych generowanych przez inne modele AI. Naukowcy twierdzą, że taki proces może prowadzić do "zanieczyszczenia" wyników, co oznacza, że oryginalna treść danych jest zastępowana niepowiązanymi ze sobą nonsensami. W efekcie, po kilku generacjach, modele AI mogą zacząć generować treści, które nie mają żadnego sensu.

Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego zespół, korzystając z modeli matematycznych, zilustrowali, jak modele AI mogą doświadczać "upadku". Wykazali, że AI może pomijać pewne wyniki (np. mniej powszechne fragmenty tekstu) w danych treningowych, co prowadzi do sytuacji, gdy trening odbywa się tylko na części zestawu danych.

Badacze przeprowadzili również analizę, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI prowadzi do degradacji kolejnych generacji modeli pod względem zdolności do uczenia się, co ostatecznie prowadzi do "upadku modelu".