Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-25, godz. 16:30 Agencja Uzbrojenia: trwa proces pozyskiwania okrętu podwodnego w ramach programu Orka Trwa proces pozyskiwania okrętu podwodnego w ramach programu Orka - zapewniła w czwartek Agencja Uzbrojenia zaprzeczając - jak podkreślono - 'pojawiającej… » więcej 2024-07-25, godz. 16:30 Komisja śledcza ds. wyborów korespondencyjnych dyskutuje nad raportem końcowym Dyskusja o raporcie końcowym z prac komisji odbywa się na posiedzeniu komisji śledczej ds. wyborów korespondencyjnych. Przewodnicząca komisji Magdalena Filiks… » więcej 2024-07-25, godz. 16:30 Cichocki: prokuratura wszczęła postępowanie w sprawie zlecenia zamachu na mnie (krótka4) Sygnalista zespołu ds. rozliczeń PiS sędzia Arkadiusz Cichocki powiedział, że przestępcze grupy związane ze środowiskiem pseudokibiców zleciły na niego… » więcej 2024-07-25, godz. 16:20 Łódzkie/ Szpital w Zgierzu zyskał nową aparaturę za blisko 15 mln zł Nowoczesny tomograf komputerowy, pierwsza w Polsce trójgłowicowa gamma kamera i zmodernizowany rezonans magnetyczny - to najnowsze nabytki szpitala wojewódzkiego… » więcej 2024-07-25, godz. 16:20 Cichocki: wiceminister sprawiedliwości Piebiak zaproponował mi członkostwo w KRS (krótka3) Wiceminister sprawiedliwości Łukasz Piebiak złożył mi propozycję, żebym był członkiem Krajowej Rady Sądownictwa - powiedział b. prezes Sądu Okręgowego… » więcej 2024-07-25, godz. 16:20 Kraków/ Ponad 33 tys. osób zdecydowało, że będzie płacić podatki w mieście Ponad 33 tys. osób, które mieszkają w Krakowie, ale do tej pory rozliczały się z fiskusem w innych miejscowościach, zdecydowało się płacić podatki w… » więcej 2024-07-25, godz. 16:10 Kielce/ Miasto zdobyło ponad 24 mln zł na rewitalizację Doliny Silnicy Prezydent Kielc Agata Wojda poinformowała, że miasto pozyskało ponad 24 mln zł unijnego dofinansowania na rewitalizację parku Dolina Silnicy. Projekt zakłada… » więcej 2024-07-25, godz. 16:00 Mazowieckie/ Pod Płockiem dachował lexus; kierowca zginął, troje rannych w szpitalu (aktl.) W miejscowości Tchórz niedaleko Płocka na drodze krajowej nr 60 dachował w czwartek lexus. Autem podróżowały cztery osoby. Jego kierowca zginął na miejscu… » więcej 2024-07-25, godz. 16:00 Sygnalista Giertycha: Szmydt mógł mieć dostęp do danych funkcjonariuszy służb specjalnych (krótka2) Sędzia Arkadiusz Cichocki, który jako sygnalista uczestniczył w posiedzeniu Zespołu ds. Rozliczeń PiS, powiedział, że Tomasz Szmydt, sędzia, który uciekł… » więcej 2024-07-25, godz. 15:50 Zachodniopomorskie/ Kąpielisko w Lubczynie z zakazem kąpieli Sanepid wprowadził zakaz korzystania z kąpieliska w Lubczynie (jezioro Dąbie). Powodem jest wykrycie bakterii Escherichia coli - poinformował w czwartek Główny… » więcej
45678910
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »