Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-25, godz. 20:00 UE/ Polska spóźniona z wdrażaniem przepisów kredytowych Polska jest jednym z 12 państw członkowskich, które nie wdrożyły do prawa krajowego unijnej dyrektywy o podmiotach obsługujących kredyty i o nabywcach kredytów… » więcej 2024-07-25, godz. 20:00 Opole/ NIK o niegospodarności b. wojewody opolskiego Brak staranności przy doborze kandydata na stanowisko doradcy i nietransparetne wydawanie pieniędzy w czasie kampanii wyborczej do parlamentu - to część zarzutów… » więcej 2024-07-25, godz. 19:50 Ludność cywilna w Powstaniu Warszawskim - wystawa archiwalnych fotografii od poniedziałku Wystawa pt. „Od pożarów i spalenia żywcem - wybaw nas, Panie - Ludność cywilna w Powstaniu Warszawskim' poświęcona pamięci cywilnych mieszkańców stolicy… » więcej 2024-07-25, godz. 19:50 Polskie systemy przeciwlotnicze Piorun zgłoszone do unijnego programu Cztery kraje - Polska, Litwa, Łotwa i Norwegia w ramach wspólnego konsorcjum zgłosiły do unijnego programu wspierającego rozwój zdolności obronnych wspólne… » więcej 2024-07-25, godz. 19:50 UE/ KE wszczęła wobec Polski postępowanie o naruszenie prawa UE ws. przepisów o lotnictwie Komisja Europejska wszczęła w czwartek wobec Polski i 16 innych państw członkowskich postępowanie w sprawie naruszenia prawa unijnego w związku z nieprawidłowym… » więcej 2024-07-25, godz. 19:50 Rzeczniczka wojewody śląskiego: zgłoszenia na numery alarmowe są przyjmowane W Centrum Powiadamiania Ratunkowego w Katowicach w czwartek doszło do awarii. Rzeczniczka Śląskiego Urzędu Wojewódzkiego poinformowała, że mimo tego zgłoszenia… » więcej 2024-07-25, godz. 19:50 Sejm przerwał obrady W czwartek przed godz. 20 Sejm przerwał obrady. Wznowi je w piątek o godz. 9. » więcej 2024-07-25, godz. 19:50 Formuła 1 - Ocon od przyszłego sezonu kierowcą Haasa Broniący barw zespołu Alpine Francuz Esteban Ocon od przyszłego sezonu mistrzostw świata Formuły 1 będzie kierowcą Haasa - poinformował amerykański team… » więcej 2024-07-25, godz. 19:50 W piątek pierwsza część obrad Sejmu najprawdopodobniej utajniona (aktl.) Piątkowe obrady Sejmu rozpoczną się od głosowania nad wnioskiem Prezydium Sejmu ws. utajnienia pierwszej części obrad. Posłowie mają zająć się wnioskiem… » więcej 2024-07-25, godz. 19:40 Paweł Łatuszka laureatem wznowionej Nagrody Solidarności im. Lecha Wałęsy Jeden z liderów białoruskiej opozycji Paweł Łatuszka został laureatem tegorocznej, wznowionej Nagrody Solidarności im. Lecha Wałęsy - poinformowało w… » więcej
45678910
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »