
Fazekas István, az AIP Labs társalapítója.
A cikk megjelenését az AIP Labs támogatta.
De mégis, hogyan működik mindez? Ennek megértéséhez először tisztáznunk kell néhány alapfogalmat. A gépi tanulás az a terület, ahol a számítógépek tanulnak a tapasztalatokból anélkül, hogy explicit programoznánk őket. A deep learning pedig a gépi tanulás egy speciális ága, amely neurális hálózatokkal dolgozik. Ezek a hálózatok olyanok, mint az emberi agy: neuronokból épülnek fel, és az információ áthalad rengeteg kapcsolaton keresztül.
Ez az adathiány nem csak pénzügyileg megterhelő az ezzel foglalkozó vállalkozások és kutatók számára, hanem gátolja is a mesterséges intelligencia fejlődését.
Magyar fejlesztők azonban rájöttek arra, hogy képesek olyan fejlett, úgynevezett generatív mesterséges intelligenciát gyártani, amely meglévő adatokból, újabb adatokat képes generál.
Tehát, már meglévő bőrbetegségek képéből, eltérő, de ugyanazon betegségekről szóló szintetikus képeket tud készíteni. Ezzel a megoldással, számtalan problémát ki lehet küszöbölni, így azt is, hogy egyes ritka betegségekről nagyon kevés képi anyag van. Az AIP Labs kutatói tanulmányt is közöltek eredményeikről, amit azóta nemzetközileg is felkaptak.
Gyógyír a tanulásra
Felmérések alapján kijelenthető, hogy egyre több betegre egyre kevesebb orvos jut világszerte, nőnek a várólisták. Ezért kulcskérdéssé válik az egészségügy fenntarthatósága szempontjából, hogy az MI át tudja-e venni részben az orvosok munkáját, és segíteni őket a gyors diagnózis alkotásban.
A bőrbetegségek detektálásához és egyéb orvosi diagnózisalkotáshoz a gépi tanulásnak rengeteg adatra van szüksége, különösen címkézett képekre. Nem maga a fotó a kulcs, hanem a képekhez rendelt címkék, amelyek segítik a gépi tanulást. Bőrgyógyászat területén tehát nem is a bőrbetegségről szóló kép az érték, hanem az, hogy tudjuk, a képen biztosan például ekcéma látható. Na de mi van akkor, ha nincs elegendő címkézett adat, vagyis nincs annyi kép egy-egy ritka betegségről, amely elegendő ahhoz, hogy a diagnosztikai MI-t betanítsa?
Ekkor jön képbe a generatív mesterséges intelligencia, amit az AIP Labs fejlesztett: a generatív modell valós képeken tanul, majd létrehoz olyan képeket, amelyek hasonlítanak a valódiakra. A megoldás egy úgynevezett diffúziós modell, ami a valós adatokból származó információkat felhasználva hoz létre szintetikus képeket. A szintetikus képek gyakran segíthetnek más, a cég által fejlesztett képfelismerő egészségügyi mesterséges intelligenciák teljesítményének javításában, különösen, ha a nincs elegendő mennyiségű címkézett adat. Például ritka bőrbetegségek esetén, mint a majomhimlő, aminek felismerése kulcskérdés lett, így egy kis számú adatsorból gyorsan lehet nagy számú adatsort csinálni, amelyet az orvosi validáció után fel lehet használni a gépi tanuláshoz.
Miért baj a kevés kép? Az egyik kihívás az, hogy kevés bőrbetegség esetén a gépi tanuló modell nem feltétlenül ismeri fel őket olyan hatékonyan. A generatív modell ebben a helyzetben lép előtérbe, mivel lehetőséget nyújt számunkra, hogy létrehozzunk olyan szintetikus adatokat, amelyek segítenek a modell továbbfejlődésében.
Mindez a mesterséges intelligencia fejlesztésben jól ismert “overfitting” jelenségére is gyógyírt nyújt. Overfitting az, amikor a gépi tanulásban egy modell túlságosan alkalmazkodik a tanítóadatokhoz, és ezáltal gyenge teljesítményt mutat új adatokon. Egy egyszerű példa segíthet megérteni ezt a fogalmat. Képzeljük el, hogy matematika érettségire készít fel a tanár egy gimnáziumi csoportot. Abból indul ki, hogy a feladatok nagyon hasonlóak az érettségin, ezért a tavalyi érettségi feladatsor típusfeladatait gyakoroltatja egész évben a diákokon. A diákok teljesítménye láthatóan javul is, a végére már nagyon jól megoldják a matekpéldákat. Az érettségin azonban idén sok új fajta feladat is lesz. Mi fog történni?
A diákok, mivel egy adott feladatot tanultak meg megoldani, nem értik meg a mögöttük álló matematikai alapelveket, és nem tudják matektudásukat más problémákra is hatékonyan alkalmazni. Így ők "túltanultak" egy fajta példán, ezért a tudásuk nem általánosítható más helyzetekre. Ugyanez igaz a mesterséges intelligenciára is. Ha a modell túlságosan összpontosít a tanítóadatokra, az azt eredményezheti, hogy nem tudja jól kezelni az új és változatos adatokat. Mindezt megoldja, hogy az AIP Labs már szintetikusan is létre tud hozni, új “matekpéldákat”, a régi érettségi feladatsorokból.
Persze mindez nem egyszerű: meg kellett tanítani az új MI modult, hogy hogyan változtasson át pixeleket úgy, hogy az eredeti képhez nagyon hasonlítson, de mégis minden pixelében más legyen. Most már azonban ott tartunk, hogy sok esetben a szintetikus képek jobb minőségűek, mint az eredetiek.
A generatív mesterséges intelligencia így nem csak egyszerűen tanul a meglévő adatokból, hanem alkot is.
Egy olyan virtuális művész, aki nem csak érti a képeket, hanem képes saját műalkotásokat létrehozni. És ezzel tanítani, más Mesterséges Intelligenciákat.
A cikk szerzője az AIP Labs társalapítója.
Címlapkép: AIP Labs
Bulgária meghibásodás miatt lekapcsolja atomerőművének egyik reaktorát
Elővigyázatossági lépés.
Magyarázatot vár Oroszország: egyszerűen nem értik Donald Trump lépését
Meglepetést okozott az Egyesült Államok elnöke.
Megkongatták a vészharangot: teljesen kivéreztetnék Magyarország kulcságazatát
Az Európai Bizottság terve nagy gondot okozhat a NAK szerint.
Limit, Stop, vagy Piaci? Megbízások, amikkel nem lősz mellé! – online előadás kezdő kereskedőknek
Amit a tőzsdéről mindekinek tudnia kell.
Meglepetésre távozott a Renault vezére, már itt is van az utódja
Ideglenes megoldás született.
Végre kimondták: nem kell tovább fenntartani a projekteket
Miközben sok pályázó már túl van a projektje fenntartásán, a Hatóság csak most tisztázta a legfontosabb kérdést.
Miért nem emelkedik mindig az infláció, ha vámot emelnek?
Súlyos inflációt jósoltak az elemzők, amikor Donald Trump áprilisban bedurrantotta a vámháborút, és jogosan: a vámok növelik az importált termékek árát, ami végső soron a... The post Mié
Szegény, de szexi...
Kicsit kapitalista, kicsit szocialista; kicsit nyugati, kicsit keleti; kicsit drága, kicsit olcsó: ez Berlin Zentuccio szemüvegén át. A HOLDBLOG állandó világutazó szerzője a német fővárosról
Top 10 osztalék részvény - 2025. július
Július elsején kijött Justin Law listája az osztalékfizető részvényekről, sorba is rendeztem őket gyorsan, itt az eredmény.Fontosabb infók a lista összeállításával kapcsolatbanElőző hón
Mi a baj a statisztikáról szóló törvény új, anonimizálásra vonatkozó definíciójával?
A Magyarország versenyképességének javítása érdekében egyes törvények módosításáról szóló 2025. évi LXVII. törvény* több ponton is módosította a hivatalos statisztikáról szóló
Hulladékhő újragondolva: így fűtik Finnországban az otthonokat
Az adatközpontok működése hatalmas mennyiségű hőt termel, amely a legtöbb helyen kárba vész. A pazarlást felismerve Finnország a számítógépes feldolgozólétesítmé
A TB kiskönyv múltja, jelene és digitális jövője
A magyar társadalombiztosítási rendszer egyik ikonikus, papíralapú dokumentuma, a köznyelvben csak TB kiskönyvként ismert igazolvány hamarosan digitális formában él tovább. Bár sok munkáltat
Balásy Zsolt (és a HOLD) új kollégát keres
Az After Hoursben is elhangzott, a LinkedIn-en is fent van: junior elemző kollégákat keres a HOLD. Ritkán hirdetünk meg elemzői állást nyilvánosan, szóval kérünk minden... The post Balásy Zsol


Vége a pénzesőnek? Fájni fog a kiszivárgott EU-s agrárreform
Teljesen más világ jöhet, ha megvalósulnak a brüsszeli tervek.
Pokoli hónapok után vérszegény időket várnak az elemzők
Érkeznek a második negyedév amerikai vállalati beszámolói.
Csúnya képet mutathat egy fontos mutató Magyarországon
A trendek alapján baljósak a kilátások.
Limit, Stop, vagy Piaci? Megbízások, amikkel nem lősz mellé!
Ismerd meg a tőzsdei megbízások világát, és tanulj meg profin navigálni a piacokon!
Hogyan vágj bele a tőzsdei befektetésbe?
Első lépések a tőzsdei befektetés terén. Mire kell figyelned? Melyek az első lépések? Mely tőzsdei termékeket célszerű mindenképpen ismerned?