Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-25, godz. 17:40 Paryż/wioślarstwo - tylko dwie polskie osady, ale z dużą szansą medalową Do igrzysk olimpijskich w Paryżu zakwalifikowały się tym razem dwie polskie osady wioślarskie, czyli o cztery mniej niż do Tokio. Seria medalowa biało-czerwonych… » więcej 2024-07-25, godz. 17:40 Poznań/ Rusza nabór wniosków o dofinansowanie z Rządowego Funduszu Rozwoju Dróg Rusza nabór wniosków o dofinansowanie zadań polegających na budowie, przebudowie lub remoncie dróg powiatowych oraz dróg gminnych z Rządowego Funduszu Rozwoju… » więcej 2024-07-25, godz. 17:40 Paryż - 19 medali polskich wioślarzy (dokumentacja) Polscy wioślarze zdobyli 19 medali olimpijskich: po cztery złote i srebrne oraz 11 brązowych. W rozpoczynających się w piątek igrzyskach w Paryżu wystartują… » więcej 2024-07-25, godz. 17:40 Nigeria/ Policja konfiskuje opony, aby zapobiec ich paleniu podczas zapowiedzianych protestów Przed zaplanowanym na 1 sierpnia ogólnokrajowym protestem przeciwko rządom prezydenta Bola Tinubu szef policji nigeryjskiej nakazał swym podwładnym dokonanie… » więcej 2024-07-25, godz. 17:40 Sejm/ Komisja ds. wyborów korespondencyjnych: Morawiecki nie działał w granicach prawa (krótka2) Były premier Mateusz Morawiecki nie działał w granicach prawa i nadużywał swoich kompetencji - wynika z przedstawionego w czwartek projektu raportu sejmowej… » więcej 2024-07-25, godz. 17:40 GIS ostrzega przed błędnie oznaczonym piwem Główny Inspektorat Sanitarny poinformował w czwartek o wycofaniu jednej partii piwa Żywiec Jasne Pełne 0,5 l z błędną etykietą na niektórych butelkach… » więcej 2024-07-25, godz. 17:40 CAS oddalił apelację Rosjan ws. złotego medalu igrzysk w Pekinie w łyżwiarstwie figurowym Międzynarodowy Trybunał Arbitrażowy ds. Sportu (CAS) oddalił w czwartek apelację Rosjan od decyzji o pozbawieniu złotego medalu ich reprezentacji w konkursie… » więcej 2024-07-25, godz. 17:40 Macierewicz: samolot Tu-154M nr 102 został zniszczony w 2012 r., a nie przez podkomisję smoleńską Wypowiedź wiceszefa MON Cezarego Tomczyka, że Tu-154M nr 102 został zniszczony przez członków podkomisji smoleńskiej, jest fałszywa - napisał w oświadczeniu… » więcej 2024-07-25, godz. 17:40 Francja/ "Le Monde": zatrzymany Rosjanin miał od dawna kontakty ze służbami Zatrzymany we Francji Rosjanin, który zamierzał zaaranżować incydent na otwarciu igrzysk olimpijskich, to 40-letni Kiriłł Grjaznow; prawnik z wykształcenia… » więcej 2024-07-25, godz. 17:40 Japonia i Niemcy przeprowadziły pierwsze wspólne ćwiczenia z wykorzystaniem myśliwców Niemcy i Japonia zakończyły w czwartek pierwsze w historii wspólne ćwiczenia sił powietrznych - pisze portal The Japan Times. Odbyły się one w obliczu rosnącej… » więcej
1234567
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »