Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-26, godz. 08:20 Radosław Włoszek prezesem spółki samorządowej Koleje Małopolskie Radosław Włoszek, były prezes Lotniska Kraków Airport, został powołany na stanowisko prezesa samorządowej spółki przewozowej Koleje Małopolskie. Zastąpił… » więcej 2024-07-26, godz. 08:00 Paryż – celem organizatorów najbardziej zrównoważone ekologicznie igrzyska w historii Organizatorzy igrzysk olimpijskich w Paryżu zapowiadają, że tegoroczna impreza będzie 'inna niż wszystkie'. Nie tylko pod względem sportowym. Ich ambitnym… » więcej 2024-07-26, godz. 08:00 ESA: Ponad 35 tys. obiektów znajduje się na orbicie Ziemi - 74 proc. to śmieci Ponad 35 tys. obiektów znajduje się na orbicie Ziemi, z czego ok. 26 tys. to śmieci o średnicy większej niż 10 cm - podała Europejska Agencja Kosmiczna… » więcej 2024-07-26, godz. 08:00 Ukraina/ Zatrzymano 19 osób, które szykowały podpalenia miejsc masowo odwiedzanych Służba Bezpieczeństwa Ukrainy i policja poinformowały o zatrzymaniu 19 osób, które planowały podpalenie centrów handlowych, stacji benzynowych, aptek i… » więcej 2024-07-26, godz. 07:30 Techno w Roglinku, blues we Wrocławiu, tango w Poznaniu - alternatywne festiwale muzyczne W lipcu i w sierpniu w wielu miastach w Polsce zaplanowano festiwale poświęcone alternatywnym gatunkom muzycznym i niezależnym twórcom. W planach są zarówno… » więcej 2024-07-26, godz. 07:30 Rosja/ Wybuch na terenie złoża ropy i gazu; jedna osoba zabita, są ranni Jeden robotnik zginął, a siedmiu zostało rannych na skutek wybuchu na terenie złoża ropy i gazu w Jamalsko-Nienieckim Okręgu Autonomicznym w rosyjskiej Arktyce… » więcej 2024-07-26, godz. 07:30 Płaszcz "Kotwy" i nie tylko - 80. przedmiotów z Powstania Warszawskiego od 31 lipca w MPW Płaszcz Eugeniusza Ajewskiego 'Kotwy', który służył do kamuflażu, stanowił imitację stroju folksdojcza i niejednokrotnie ocalił mu życie - będzie można… » więcej 2024-07-26, godz. 07:30 Ultratriathlonistka Pyszka-Bazan: każdy Ironman to osobista podróż W piątek rano w niemieckim Lensahn rozpoczęła się rywalizacja w ultratriathlonie, a jedną z uczestniczek zmagań na dystansie potrójnego Ironmana jest Alicja… » więcej 2024-07-26, godz. 07:20 Znany ukraiński dysydent: nienawiść czyni cię podobnym do tego, z kim walczysz „Le Figaro” nazywa go „ukraińskim Vaclavem Havlem”, a „Le Monde” jednym z najważniejszych intelektualistów Ukrainy. Działacz na rzecz praw człowieka… » więcej 2024-07-26, godz. 07:10 "Rz": Kontrola NIK - Black Hawki jak Pegasus NIK znów krytykuje zakup supernowoczesnych śmigłowców Black Hawk dla policji; zdaniem kontrolerów wypłata kolejnej transzy zaliczki była nierzetelna - podaje… » więcej
9101112131415
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »