Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-08-04, godz. 07:20 Sebastian Riedel: Poszedłem drogą kontynuacji. Ważna jest dla mnie pamięć o ojcu (wywiad) Poszedłem drogą kontynuacji. Ale w planach mamy też zupełnie nowy materiał. Kiedy do sklepów trafi płyta, będę mógł powiedzieć, że dołożyłem własną… » więcej 2024-08-04, godz. 07:20 Grecja/ Ekspert: główny spór między Atenami i Ankarą dotyczy morza Od kilku lat najbardziej sporną kwestią dzielącą Ateny i Ankarę jest delimitacja wyłącznych stref ekonomicznych na Morzu Śródziemnym - powiedział PAP… » więcej 2024-08-04, godz. 07:20 Szef Muzeum Gombrowicza: nie ma tu typowego zadęcia, ludzie wychodzą z głową pełną wiedzy o pisarzu (wywiad) Zabiegamy, aby muzeum stało się instytucją samodzielną, współprowadzoną przez Samorząd Mazowsza i MKiDN. Mamy potencjał, by robić więcej dla polskiej… » więcej 2024-08-04, godz. 07:10 Kalendarz rocznic 5-11 sierpnia 5 sierpnia ---------- 1461 - W Krakowie urodził się przyszły król Polski i wielki książę litewski Aleksander Jagiellończyk. 1579 - W Capranicy koło… » więcej 2024-08-04, godz. 07:00 Paryż - dodatkowy stres oraz wioska olimpijska nie ułatwiały debiutantom rywalizacji Polscy debiutanci w igrzyskach olimpijskich w Paryżu różnie oceniają swoje pierwsze występy. Jedni są bardziej zadowoleni, inni znacznie mniej, chociaż… » więcej 2024-08-04, godz. 07:00 80 lat temu zginął Krzysztof Kamil Baczyński, jeden z najwybitniejszych poetów pokolenia Kolumbów Krzysztof Kamil Baczyński był autorem zaledwie pięciu tomików wierszy, a jednak uważa się go za najwybitniejszego poetę pokolenia Kolumbów. Zginął 80… » więcej 2024-08-04, godz. 06:50 A Gombrowicz nadal wielkim pisarzem jest.... Uczy krytycznego myślenia, podważa patriotyczne klisze, odkrywczo opisał opresyjność społecznych relacji - to frazy najczęściej przewijające się w odpowiedziach… » więcej 2024-08-04, godz. 06:50 120 lat temu urodził się Witold Gombrowicz - mistrz zrywania masek Nazywany mistrzem zrywania masek, uznawany za tego, który najpełniej w literaturze opisał grę i teatralność relacji międzyludzkich, jeden z najciekawszych… » więcej 2024-08-04, godz. 06:40 Alfred Lenica – 125. rocznica urodzin malarza Jeden z najważniejszych artystów polskiej awangardy XX wieku, z wykształcenia profesjonalny skrzypek, urodził się 4 sierpnia 1899 roku w Pabianicach, zmarł… » więcej 2024-08-04, godz. 06:20 Paryż/wioślarstwo - brązowa Litwinka Senkute ze specjalnym przesłaniem Viktorija Senkute, która zdobyła na igrzyskach w Paryżu pierwszy medal dla Litwy - brązowy w wioślarskiej rywalizacji jedynek, ma nadzieję, że jej sukces… » więcej
25262728293031
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »