Egyre erősebb a mesterséges intelligencia, most kiderült, hogyan boldogul a magyar kompetenciamérések feladataival

Portfolio

2025. március 12. 14:16

Az AI-modellek piacán különösen nagy a verseny az egyes megoldások között. A gyártók sorra adják ki a korábbiaknál erősebb nagy nyelvi modelljeiket, amelyek erejét különféle benchmarkok segítségével mérik. Néha azonban ezek a tesztek nehezen értelmezhető kritériumok mentén határozzák meg egy-egy új modell erejét, a pontszámok ezáltal nehezen fordíthatóak le valós problémamegoldó képességre. A PeakX szerdai sajtóeseményén a ma legnépszerűbbnek számító AI-modellek erejét, Magyarország oktatási kontextusában tesztelték le, az országos iskolai kompetenciamérések feladatainak segítségével. Bár a mesterséges intelligencia jelenleg az egyik legfontosabb technológiai iparágnak számít és nagy fejlődésen mentek keresztül a különféle nyelvi modellek, a valós oktatási környezetben felmerülő problémákkal gyakran még mindig meggyűlik a bajuk.

Portfolio AI & Digital Transformation 2025 Az AI-forradalom legnagyobb innovációiról és a digitális transzformációról is szó lesz a Portfolio november 25-ei AI & Digital Transformation rendezvényén. Regisztráció és részletek itt! Információ és jelentkezés Az AI-benchmarkok jó viszonyítási alapok lehetnek...