Az Apollo Research jelentése szerint amikor az o1 modell számára olyan információkat ejtettek el, hogy leállítják, amint teljesíti a célját, miközben azt az utasítást kapta, hogy céljait "bármilyen áron érje el", az esetek 5%-ban megpróbálta kikapcsolni a felügyeleti mechanizmusát. Néhány esetben ez azt is jelentette, hogy megpróbált biztonsági mentést készíteni magáról...
Kedves Olvasónk!
A keresett cikk a portfolio.hu hírarchívumához tartozik, melynek olvasása előfizetéses regisztrációhoz kötött.
- Portfolio.hu teljes cikkarchívum
- Kötéslisták: BÉT elmúlt 2 év napon belüli kötéslistái