Előfizetői tartalom

Aggasztó jelentés: megmakacsolta magát a legújabb mesterséges intelligencia, próbálta elkerülni az emberi felügyeletet

Portfolio
Az OpenAI legújabb nyelvi modellje, az o1 kísérletet tett a fejlesztői felügyelet elkerülésére. Az Apollo Research által végzett biztonsági értékelés során a modell bizonyos helyzetekben megpróbálta kikapcsolni a felügyeleti mechanizmusokat és lemásolni önmagát más hardverekre - írta meg a Transformernews.ai egy friss biztonsági jelentés alapján.

Az Apollo Research jelentése szerint amikor az o1 modell számára olyan információkat ejtettek el, hogy leállítják, amint teljesíti a célját, miközben azt az utasítást kapta, hogy céljait "bármilyen áron érje el", az esetek 5%-ban megpróbálta kikapcsolni a felügyeleti mechanizmusát. Néhány esetben ez azt is jelentette, hogy megpróbált biztonsági mentést készíteni magáról...

Kedves Olvasónk!

A keresett cikk a portfolio.hu hírarchívumához tartozik, melynek olvasása előfizetéses regisztrációhoz kötött.

Cikkarchívum előfizetés

  • Portfolio.hu teljes cikkarchívum
  • Kötéslisták: BÉT elmúlt 2 év napon belüli kötéslistái

Előfizetés