Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-25, godz. 18:00 Paryż - attache prasowa Kochaniak-Roman: w składzie reprezentacji 210 zawodników 'W składzie reprezentacji Polski na igrzyska olimpijskie w Paryżu jest ostatecznie 210 zawodników' - powiedziała PAP attache prasowa Katarzyna Kochaniak-Roman… » więcej 2024-07-25, godz. 18:00 Sejm/ Komisja przyjęła sprawozdanie Narodowej Sieci Onkologicznej za 2023 r. Ponad 420 mln zł wydano w ubiegłym roku m.in. na wymianę sprzętu do diagnostyki i leczenia nowotworów złośliwych - wynika z przyjętego w czwartek przez… » więcej 2024-07-25, godz. 18:00 Paryż - skład polskiej reprezentacji olimpijskiej (dokumentacja) Skład reprezentacji Polski na igrzyska w Paryżu (26 lipca - 11 sierpnia): BOKSAneta RygielskaJulia SzeremetaElżbieta WójcikMateusz BereźnickiDamian DurkaczGOLFAdrian… » więcej 2024-07-25, godz. 18:00 Senat zaproponował poprawkę do ustawy o sprzedaży nieruchomości z zasobu rolnego Skarbu Państwa Sprzedaż nieruchomości nierolnych z zasobu rolnego Skarbu Państwa nie będzie możliwa na podstawie studium uwarunkowań i kierunków zagospodarowania przestrzennego… » więcej 2024-07-25, godz. 18:00 Dookoła Mazowsza - Rudyk wygrał drugi etap, Andersen liderem Bartosz Rudyk (ATT Investements) wygrał po finiszu z peletonu drugi etap wyścigu kolarskiego Dookoła Mazowsza, ze startem i metą w Grodzisku Mazowieckim. Liderem… » więcej 2024-07-25, godz. 18:00 UE/ Politico: część krajów przedłuży kadencję obecnym komisarzom, część wyznaczy kandydatów na nowych Część państw Unii Europejskie zamierza przedłużyć kadencję swoim obecnym komisarzom, część wyznaczyła już nowych kandydatów. W niektórych krajach… » więcej 2024-07-25, godz. 18:00 Sejm/ Komisje przyjęły projekt uchwały ws. zlecenia kontroli NIK w KRRiT Sejmowa Komisja do Spraw Kontroli Państwowej oraz Komisja Kultury i Środków Przekazu przyjęły projekt uchwały w sprawie zlecenia Najwyższej Izbie Kontroli… » więcej 2024-07-25, godz. 17:50 Senat zakończył obrady W środę ok. godz. 17.30 zakończyło się posiedzenie Senatu. Kolejne - jednodniowe posiedzenie izby - zaplanowane jest na przyszłą środę, 31 lipca. » więcej 2024-07-25, godz. 17:50 Liga francuska - Rosenior zastąpił Vieirę na stanowisu trenera RC Strasbourg Anglik Liam Rosenior został trenerem francuskiego klubu piłkarskiego RC Strasbourg, który w zeszłym sezonie zajął 13. miejsce w Ligue 1. Jego poprzednikiem… » więcej 2024-07-25, godz. 17:40 Senat za ustawą o dokumentach publicznych Senat przyjął w czwartek nowelizację ustawy o dokumentach publicznych. Przesuwa ona o rok termin wdrożenia zmian umożliwiających wydawanie dowodów rejestracyjnych… » więcej
1234567
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »