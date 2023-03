A mesterséges intelligencia és a robotizáció előretörésével sokan a futószalag mellett végzett fizikai és az unalmas irodai munkák megszűnését várták. A generatív mesterséges intelligenciák megjelenése azonban úgy tűnik, a kreatív szakmát végzők és a művészek egzisztenciáját kezdte el fenyegetni, és olyan filozófiai magasságokba ívelő vitákat is újjáélesztett, minthogy mit jelent az emberi kreativitás. Cikkünkben utánajártunk, miért nézi rossz szemmel a kreatív iparág a generatív rendszerek hihetetlenül gyors fejlődését.

Digital Transformation 2023 A jövő digitális vívmányairól és a legfontosabb technológiai fejlesztésekről is lesz szó a Portfolio május 3-ai Digital Transformation konferenciáján!

„A művészet halott, haver”

A tavaly szeptemberi Colorado State Art Fair művészeti fesztivál zsűrije nem várt eredményt hirdetett: a digitális művészeti szekció díját egy teljes egészében mesterséges intelligencia által készített alkotás nyerte el. A Théâtre D'opéra Spatial (magyarul Űroperaszínház) című alkotás ugyan nem egy élő művész keze munkáját dicséri, a díjat mégis egy ember, Jason M. Allen vehette át, aki provokatív kijelentésével, miszerint „a művészet halott”, azonnal magára haragította a teljes szakmát.

Vége: a mesterséges intelligencia győzött, az emberiség veszített

– borzolta tovább a kedélyeket Allan.

Théâtre d'opéra spatial. Forrás: Jason Allen

A művészvilág már jóval ezelőtt a szimbolikus esemény előtt is aggódva figyelte a generatív mesterséges intelligenciák fejlődését. Sokan attól tartanak, hogy az egyre finomodó modellek miatt veszélybe kerülhet az állásuk; mások az emberi kreativitást féltik, de olyanok is akadnak, akik sérelmezik, hogy

a mesterséges intelligenciák fejlesztői a beleegyezésük és bármiféle jogdíj kifizetése nélkül használták fel alkotásaikat a modellek betanítására.

A fenti aggodalmak mélyebb megértése érdekében érdemes sorra venni, hogy mik ezek a generatív modellek, amelyek kiverték a biztosítékot a művészeknél.

Diffúz modellek

Allen az inkriminált képet a Midjourney segítségével készítette, ugyanakkor több tucat ehhez hasonló eszköz érhető már el az interneten, egy részük ráadásul teljesen ingyen. A legnépszerűbb és a legjobb minőségű illusztrációkat készítő szöveg-kép generátor a Dall-E 2, amelyet a ChatGPT-t is megalkotó OpenAI fejleszt. A szintén népszerű Stable Diffusion abban egyedi, hogy viszonylag transzparenssé tették a szoftver működését, vagyis nyilvános a forráskódja. Emiatt a képgenerátort a körülötte szerveződő fejlesztői közösség teszi igazán különlegessé. Egy felhasználó például egy Photoshop bővítményt is létrehozott a Stable Diffusionhöz, de a Krita nevű digitális képszerkesztőhöz is készült egy változat.

A képgenerátorok mellett léteznek videót, illetve zenét vagy más hangokat szöveges bevitel útján létrehozó mesterséges intelligenciák is. A generatív modellek együttes felhasználásának lehetőségeit összességében jól szemlélteti az a kezdetlegessége miatt elsőre talán bénának tűnő sitcom, amelyet teljes egészében AI írt. A végtelenített sorozat sugárzását egyébként egy véletlenül generált transzfób kijelentés miatt rekesztették be az alkotók.

A legtöbb képgeneráló mesterséges intelligencia úgynevezett diffúz modellen alapul. Ezek a rendszerek úgy tanulnak, hogy megpróbálják helyreállítani az adatokat a zajkeltési folyamat megfordításával, vagyis a modellek a zajból generálnak koherens képeket. A zaj eltüntetésével a modell fokozatosan javítja a kép minőségét, amíg az a lehető legpontosabban megfelel a bevitt szöveg tartalmának. A modell ezt követően a megtanult a zajmentesítési folyamatot alkalmazza a véletlenszerűen bevitt utasításokra (prompt), amelyekből aztán új képeket hoz létre.

A fent leírt technikai folyamat révén a rendszer olyan új tartalmakat generál, amelyek hasonlítanak ugyan a képzési adatokra, azonban nem azonosak velük. Ha mondjuk mutatnak a mesterséges intelligenciának több millió képet egy kutyáról, akkor az egy azelőtt nem létező, az adathalmazban fel nem lelhető kutyaábrázolást fog visszaadni.

Az eredmények emberi műalkotásokra emlékeztetnek – még akkor is, ha minden modellnek egyedi „stílusa" van – mivel rajzok, festmények és fényképek millióin képezték ki, amelyek nagy részét a fejlesztők az internetről töltötték le. És talán ez akasztotta ki legjobban a művészeket.

Veszélyben a kreatív szakmák

Az internetről leszedett anyagok közé művészek és illusztrátorok munkái is bekerültek, a fejlesztők azonban ezek felhasználásához nem kérték az alkotók beleegyezését. A nyilvánvaló etikai aggályok mellett több művész is úgy érzi, hogy ebben a formában ezek a rendszerek már a „művészetüket” fenyegetik. A mozgalmas és epikus fantasy képeiről ismert koncepcióművész, Greg Rutowski neve már több százezer, a Midjourney és a Stable Fusion modelleknek adott felhasználói utasításban szerepelt, vagyis ennyien akarták ötleteiket az ő stílusában viszontlátni.

Még csak egy hónap telt el. Mi lesz egy év múlva? Valószínűleg meg sem fogom tudni találni a munkámat, mert az internetet elárasztják majd a mesterséges intelligencia által generált képek

- nyilatkozta Rutkowski az MIT Technology Review-nak.

A mesterséges intelligenciát egyre többen használják stock képek helyett is: a Shutterstock képkönyvtár például nemrég megállapodást kötött az OpenAI-jal, hogy integrálhassa a Dall-E-t az egyik termékébe. Már kezd körvonalazódni tehát, hogy a mesterséges intelligencia először a kereskedelmi művészek munkáját veheti el. Egyre több olyan könyv, albumborító, valamint cikkcímlap készül, és kerül értékesítésre, amelyek kis változtatással alig különböztethetőek meg a hús-vér illusztrátorok munkáitól.

A művészek kompenzációjára egyelőre még nem született kielégítő megoldás, az érintettek ugyanakkor joggal érezhetik, hogy kihasználták őket. Nem is csoda, hiszen alkotásaik felhasználásával a képgenerátorokat fejlesztő cégek óriási anyagi haszonra tehetnek szert.

Lehet valódi kreativitásról beszélni?

Marcus du Sautoy, az Oxfordi Egyetem matematikusa és A kreativitás kódja című könyv szerzője szerint a képgenerátorok egyfajta "kombinációs" kreativitást valósítanak meg, hiszen az algoritmusokat arra tanítják, hogy újszerű képeket hozzanak létre a beléjük táplált többmillió kép stílusváltozatait felhasználva, és egymással vegyítve. Ez azonban még nem éri el a transzformációs kreativitás szintjét, amely potenciálisan új stílust eredményezhet.

A kreativitás eleve nehezen meghatározható fogalmát Margaret Boden, a Sussexi Egyetem mesterséges intelligencia kutatója és filozófusa, három fő kritériumhoz kötötte: az ötletnek vagy alkotásnak újnak, meglepőnek és valaki számára értékesnek kell lennie. Sokak szerint azonban a mesterséges intelligencia már az újdonság feltételét sem tudja teljesíteni. Ez főleg akkor tűnhet fel, amikor sokat használjuk ezeket a rendszereket. Az alkotások egy idő után ellaposodnak, aminek az az oka, hogy a modellek már létező képeket használnak fel.

Arról nem is beszélve, hogy a mesterséges intelligenciák "gondolkodási architektúrája" még messze nem érte utol az emberét, és ez elég gyakran meg is mutatkozik. Azt, hogy a mesterséges intelligencia mennyire nem érti a világot és a fogalmainkat, elég jól szemlélteti a következő eset: az egyik generatív mesterséges intelligencia a "lazac a folyóban" kifejezésre a folyón lefelé úszó, feldarabolt halfilék képét adta vissza.

That DALL E 2 is amazing!Salmon in the river Training is everything #dalle — Victor (Ciura) October 16, 2022

Olyan lesz mint a fotózás?

Egyre erősebbek azok a hangok is, amelyek szerint a mesterséges intelligencia kreativitásáról szóló parttalan viták tévútra viszik az eszközök valós használati értékéről folytatott diskurzust. Akik emellett érvelnek, arra emlékeztetnek, hogy kezdetben a fotózást sem tekintette művészetnek a közvélemény, kizárólag egyfajta készségnek, illetve technikai képességnek tartották. A fotózás azonban ma már teljes értékű művészeti ágnak számít, amely ráadásul egy olyan nem szándékolt hatással is járt, amely a festészetet a realisztikusabb ábrázolástól (hiszen egy fotó értelemszerűen jobban vissza tudja adni a valóságot), az absztraktabb ábrázolások felé terelte. Ez pedig egyúttal a festőművészet „belépési korlátait” is csökkentette, hiszen a szubjektívebb ábrázolásmód kevesebb technikai készséget igényelt.

Sokan arra számítanak, hogy a mesterséges intelligencia egyfajta digitális asszisztensként fogja támogatni a művészeket, akik ötleteléshez, vagy az első változatok elkészítéséhez használhatják a szoftvereket. A trend már kialakulóban van, és ezt jól mutatja, hogy az úgynevezett prompt engineeringből - amely a képek előhívásához megadott utasítások megfogalmazását jelenti - már egy kisebb iparág kezd kinőni. Az elmúlt időszakban ugyanis több olyan online piactér is alakult, ahol meg lehet vásárolni a kívánatos eredményt hozó utasításokat.