Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-26, godz. 10:50 Japonia/ Co najmniej jedna osoba zginęła po przejściu rekordowych deszczy Co najmniej jedna osoba zginęła, a trzy uważa się za zaginione na skutek ulewnych deszczy, które nawiedziły północnowschodnie regiony Japonii, powodując… » więcej 2024-07-26, godz. 10:40 Paryż/siatkówka – biało-czerwonych "do... sześciu razy sztuka" Polscy siatkarze w sobotę meczem z Egiptem w Paryżu rozpoczną podejście numer sześć do medalu olimpijskiego w XXI wieku. Statystyka nie jest korzystna dla… » więcej 2024-07-26, godz. 10:40 Grzegorz Hyży powraca z nową płytą 14 lat temu zadebiutował na scenie, 10 lat temu wydał pierwszą płytę. Ten ważny dla siebie jubileusz Grzegorz Hyży celebruje trzecią, studyjną płytą… » więcej 2024-07-26, godz. 10:40 Paryż/siatkówka - Polacy pięć razy z rzędu kończyli na ćwierćfinale (dokumentacja) Reprezentacje Brazylii, Włoch, Rosji, Stanów Zjednoczonych i Francji w pięciu poprzednich turniejach olimpijskich w ćwierćfinałach pozbawiły polskich siatkarzy… » więcej 2024-07-26, godz. 10:40 Paryż/siatkówka – biało-czerwone wracają po 16 latach, z Japonkami na inaugurację Meczem z Japonią polskie siatkarki w niedzielę rozpoczną rywalizację w turnieju olimpijskim w Paryżu. Azjatki w tym sezonie prezentują się solidnie, miesiąc… » więcej 2024-07-26, godz. 10:40 Paryż/siatkówka - Polki po raz czwarty wystąpią na igrzyskach, w dorobku mają dwa medale Polskie siatkarki dopiero po raz czwarty w historii wystąpią w turnieju olimpijskim. Wcześniej dwukrotnie zdobyły brązowe medale - w 1964 roku w Tokio i cztery… » więcej 2024-07-26, godz. 10:40 Francja/ Ministra sportu potępiła osoby chcące "sabotować igrzyska" (krótka3) W związku z atakami, które w piątek wywołały duże utrudnienia na francuskiej kolei, ministra sportu Amelie Oudea-Castera potępiła osoby chcące 'sabotować… » więcej 2024-07-26, godz. 10:30 Posłowie PiS o zarzutach wobec b. policjanta: niebywały skandal i polityczna zemsta Posłowie PiS ocenili w piątek, że zarzuty przedstawione byłemu policjantowi, który w 2022 r. nie wpuścił posłanek KO do strefy zamkniętej w pobliżu granicy… » więcej 2024-07-26, godz. 10:30 Paryż - w piątek oficjalne otwarcie Domu Polskiego W piątek o godz. 10.30 zaplanowano oficjalne otwarcie Domu Polskiego, który ma służyć biało-czerwonym sportowcom, przedstawicielom mediów oraz kibicom podczas… » więcej 2024-07-26, godz. 10:20 Śląskie/ Trwa usuwanie awarii w Centrum Powiadamiania Ratunkowego W Centrum Powiadamiania Ratunkowego w Katowicach doszło do awarii. Rzeczniczka Śląskiego Urzędu Wojewódzkiego poinformowała PAP w piątek, że trwają prace… » więcej
11121314151617
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »