Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-08-05, godz. 06:10 Powstanie Warszawskie dzień po dniu - 5 sierpnia 5 sierpnia 1944 powstańcy zdobywają obóz koncentracyjny tzw. Gęsiówkę i uwalniają 348 więźniów pochodzenia żydowskiego. Esesmani i policjanci gen. Heinza… » więcej 2024-08-05, godz. 06:10 Włochy/ Znak nakazu w mieście Portici: zatrzymać się, by się pocałować Oryginalny znak nakazu pojawił się w mieście Portici na południu Włoch. Z inicjatywy dwojga radnych w nadmorskim parku ustawiono niebieski znak z napisem:… » więcej 2024-08-05, godz. 05:40 Paryż - 5 sierpnia (program-Polacy) Program wydarzeń olimpijskich z udziałem Polaków - 5 sierpnia, poniedziałek: JEŹDZIECTWO14.00, skoki przez przeszkody indywidualnie, kwalifikacje: Dawid… » więcej 2024-08-05, godz. 05:40 Prognoza pogody na 5 i 6 sierpnia Jak informuje IMiGW południowo-zachodnia Europa znajduje się na skraju klina Wyżu Azorskiego, pozostała część kontynentu jest w zasięgu niżów znad północnego… » więcej 2024-08-05, godz. 05:40 Paryż - 5 sierpnia (program) Program wydarzeń olimpijskich 5 sierpnia - poniedziałek: 21 finałów----------BADMINTON 9.45, gra pojedyncza kobiet, o brązowy medal10.55, gra pojedyncza… » więcej 2024-08-05, godz. 05:40 Paryż - od rana emocje siatkarskie: biało-czerwoni kontra "klątwa ćwierćfinałów" W poniedziałek z samego rana (godz. 9) polscy siatkarze przystąpią do meczu ze Słowenią. Stawką miejsce w półfinale. Godzinę później o ćwierćfinał… » więcej 2024-08-05, godz. 05:40 Sudan/ Chartum zakazał osobom uciekającym przed wojną przemieszczania się do Libii Władze Sudanu ograniczają przemieszczanie się swoich obywateli do Libii, aby zapobiec przedostawaniu się tysięcy osób do granicznego miasta Al Kufra, które… » więcej 2024-08-05, godz. 05:20 "Rzeczpospolita": przedsiębiorcy obawiają się, że zabraknie im pracowników Przedsiębiorcy obawiają się, że zaostrzenie polityki imigracyjnej przez rząd doprowadzi do tego, że firmy będą miały problem z pozyskaniem pracowników… » więcej 2024-08-05, godz. 05:00 "DGP": Nie ma zielonego światła w rządzie dla emerytur stażowych Obecnie nie ma w rządzącej koalicji porozumienia co do przyjęcia emerytur stażowych - informuje w poniedziałek Dziennik Gazeta Prawna. Dodaje, że w planach… » więcej 2024-08-05, godz. 05:00 Sondaż: dla 51,4 proc. Polaków priorytetem rządu powinna być walka z rosnącymi cenami 51,4 proc. Polaków uważa, że priorytetowym zadaniem dla rządu w ciągu najbliższych miesięcy powinna być walka z rosnącymi cenami i wysokimi kwotami rachunków… » więcej
30313233343536
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »