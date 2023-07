A Rice és a Stanford Egyetem tudósai egy új tanulmányban megállapították, hogy ha mesterséges intelligencia által generált tartalmakat táplálnak mesterséges intelligencia modellekbe, akkor az idővel a kimenet minőségének romlásához vezet. Úgy tűnik, ha a generatív AI-modelleket - beleértve a nagy nyelvi modelleket és a képgenerátorokat is - elég AI által generált anyaggal képezik ki, akkor azok egyszerűen "megőrülnek" - írja a Futurism

Az AI-modellek fejlesztői jellemzően gyors eredményt akarnak elérni, így nagy a kísértés arra, hogy a rendszerek betanításához más AI-modellek által generált, szintetikus adatokat használjanak fel. Ez azonban a kutatók szerint egy autofág, vagyis önemésztő hurkot hozhat létre, amelynek kevéssé ismertek a tulajdonságai. Olyan ez, mint a mitológiai Uroborosz, vagyis a saját farkába harapó kígyó.

Elsődleges következtetésünk az összes forgatókönyv szerint az, hogy elegendő friss valós adat nélkül egy autofág hurok minden egyes generációjában a jövőbeli generatív modellek arra ítéltetnek, hogy minőségük (pontosság) vagy sokféleségük fokozatosan csökkenjen

- tették hozzá. "Ezt az állapotot nevezzük Modell Autofágia Rendellenességnek (MAD)".

Ez azt jelenti, hogy emberi munka nélkül a modellek által generált tartalmak egy idő után kiüresednek. A kutatók szerint a szintetikus tartalmakon történő ismételt képzés során a modell képzési adatainak peremén lévő, kevésbé reprezentált információk fokozatosan kezdenek eltűnni. A modell ezután egyre kevésbé változatos adatokból tud csak meríteni, és ennek eredményeképpen hamarosan összeomlik.

Az eredményeket a Futurism szerint érdemes fenntartással kezelni, mivel a tanulmány még nem került lektorálásra. A tanulmány szerint a tesztelt mesterséges intelligencia-modell csak öt szintetikus tartalommal végzett tréningkörön ment keresztül, amikor már elkezdtek mutatkozni a repedések a kimenetekben.

Problémát jelenthet, hogy a mesterséges intelligencia modelleket online adatok tömeges lekérdezésével tanítják be, általánosságban pedig igaz az is, hogy minél több adatot táplálnak egy modellbe, az annál jobban fog teljesíteni. Az online tér ugyanakkor egyre több mesterséges intelligencia által generált anyaggal van tele, amelyek szintén bekerülhetnek a képzési adatok közé, ezzel rontva hosszú távon a modellek pontosságát. Az autofág huroknak így gyakorlati implikációi is lehetnek.

Címlapkép forrása: Rick_Jo via Getty Images