Radio Opole » Kraj i świat
2024-07-25, 06:00 Autor: PAP

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.


Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.


Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.


Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.


Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.


Więcej informacji w materiale źródłowym: https://www.nature.com/articles/s41586-024-07566-y (PAP)


Autorka: Urszula Kaczorowska



uka/ zan/


Kraj i świat

2024-07-25, godz. 18:20 Filiks: decyzję o przeprowadzeniu wyborów w trybie korespondencyjnym podjął Kaczyński (krótka5) W ocenie komisji śledczej ds. wyborów korespondencyjnych decyzję o przeprowadzeniu w Polsce wyborów prezydenckich w 2020 r. w trybie korespondencyjnym podjął… » więcej 2024-07-25, godz. 18:20 Paryż - chorąży Zamojski: przygotowuję się do najważniejszego startu w życiu 'Przygotowuję się do najważniejszego startu w moim życiu' - powiedział Przemysław Zamojski, chorąży polskiej reprezentacji olimpijskiej, gracz koszykówki… » więcej 2024-07-25, godz. 18:20 KE wszczęła procedurę naruszenia prawa UE wobec Polski w sprawie systemu handlu emisjami Komisja Europejska wszczęła procedurę naruszenia przepisów UE wobec 26 państw członkowskich, w tym Polski, w związku z brakiem pełnego wdrożenia do prawa… » więcej 2024-07-25, godz. 18:20 Paryż - Włodarczyk i Zamojski poniosą polską flagę (wideo) Trzykrotna mistrzyni olimpijska w rzucie młotem Anita Włodarczyk oraz koszykarz 3x3 Przemysław Zamojski będą pełnić funkcję chorążych polskiej ekipy… » więcej 2024-07-25, godz. 18:10 Kłopotek: Kamiński i Sasin wprowadzili PWPW i Pocztę Polską w błąd (krótka3) B. Szef MSWiA Mariusz Kamiński jak i b. szef MAP Jacek Sasin wprowadzili podległe im instytucje w błąd, utrzymywali Pocztę Polską i PWPW w przeświadczeniu… » więcej 2024-07-25, godz. 18:10 Paryż - historyczna, ale tajemnicza ceremonia otwarcia na wodzie i... w wodzie O godz. 19.30 w piątek w centrum Paryża rozpocznie się historyczna ceremonia otwarcia igrzysk olimpijskich - pierwsza nie na stadionie, a... na rzece. Organizatorzy… » więcej 2024-07-25, godz. 18:10 Sejm/ Filiks: ostatnie posiedzenie komisji śledczej na przełomie sierpnia i września (krótka4) Przewodnicząca sejmowej komisji śledczej ds. wyborów korespondencyjnych Magdalena Filiks (KO) poinformowała, że ostatnie posiedzenie komisji, na którym planowane… » więcej 2024-07-25, godz. 18:10 Paryż - oni zapalali znicz (dokumentacja) Kilka powszechnie znanych nazwisk sportowców, m.in. fiński biegacz Paavo Nurmi czy amerykański pięściarz Muhammad Ali, znajduje się na liście osób zapalających… » więcej 2024-07-25, godz. 18:10 Śląskie/ Ponad 10 mln zł na wsparcie podnoszenia kompetencji w podregionach górniczych Do 10 tys. zł dofinasowania na studia podyplomowe i do 5 tys. zł na szkolenia będą mogły otrzymać osoby z podregionów górniczych woj. śląskiego, chcące… » więcej 2024-07-25, godz. 18:00 Kraków/ Dyrektor Teatru Słowackiego po rozmowie z urzędem: nie będziemy rozpamiętywać przeszłości Nie będziemy rozpamiętywać przeszłości, chcemy zająć się przyszłością, wspólnie - powiedział dyrektor Teatru im. J. Słowackiego Krzysztof Głuchowski… » więcej
1234567
Ta strona używa ciasteczek (cookies), dzięki którym nasz serwis może działać lepiej. Dowiedz się więcej »