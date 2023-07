Az arXiv nevű oldalon közzétett "How Is ChatGPT's Behavior Changing over Time?" című tanulmányban Lingjiao Chen, Matei Zaharia és James Zou kétségbe vonják az OpenAI nagy nyelvi modelljeinek (LLM), konkrétan a GPT-3.5 és GPT-4 következetes teljesítményét. API-hozzáférés segítségével tesztelték a modellek márciusi és 2023 júniusi verzióit olyan feladatokban, mint a matematikai problémamegoldás, érzékeny kérdések megválaszolása, kódgenerálás és vizuális következtetés. A GPT-4 prímszámok azonosítására vonatkozó képessége a jelentések szerint drámaian visszaesett, a márciusi 97,6 százalékos pontosságról júniusra mindössze 2,4 százalékra. Furcsa módon a GPT-3.5 ugyanebben az időszakban javuló teljesítményt mutatott.

A tanulmány annak nyomán született, hogy az emberek gyakran panaszkodtak arra, hogy a GPT-4 teljesítménye szubjektív megítélésük szerint csökkent az elmúlt hónapokban. Az okokra vonatkozó népszerű elméletek között szerepel, hogy az OpenAI lefojtja a modelleket, hogy csökkentse a számítási terheket a kimenet felgyorsítása és a GPU-erőforrások megtakarítása érdekében; a finomhangolásnak (további képzés), amelyet a káros kimenetek csökkentése érdekében végeznek nem szándékolt hatásai lehetnek; valamint egy sor alá nem támasztott összeesküvés-elmélet, például az, hogy az OpenAI csökkenti a GPT-4 kódolási képességeit, hogy több ember fizessen a GitHub Copilotért.

Eközben az OpenAI következetesen cáfolta azokat az állításokat. Múlt csütörtökön az OpenAI termékért felelős alelnöke, Peter Welinder a következőt tweetelte:

Nem, nem tettük butábbá a GPT-4-et. Épp ellenkezőleg: minden egyes új verziót okosabbá teszünk az előzőnél. Jelenlegi hipotézis: Amikor többet használod, elkezdesz olyan problémákat észrevenni, amiket korábban nem láttál.

Az OpenAI tisztában van az új kutatással, és azt mondja, hogy figyelik a GPT-4 csökkenő képességeiről szóló jelentéseket.

Az eredmények nem győztek meg minden szakértőt, de szerintük a fokozódó bizonytalanság egy nagyobb problémára utal, mégpedig arra, hogy az OpenAI nem közöl részleteket a modelljeiről. A kritikusok újra és újra rámutatnak az OpenAI jelenlegi zárt megközelítésére a mesterséges intelligenciával kapcsolatban.

A cég ugyanis a GPT-4 esetében nem fedte fel a képzési anyagok forrását, a forráskódot, a neurális hálózat súlyait, sőt még az architektúrát leíró dokumentumot sem.

