A mesterséges intelligenciával foglalkozó OpenAI a héten bemutatta GPT-4o nevű új modelljét, ami már nemcsak szöveget, hanem képeket is képes generálni. A felhasználók természetesen azonnal rákaptak erre, a klasszikusabb mémek és fotók mellett japán animációs filmek, pontosabban a legendás Oscar-díjas rendező,
Hajao Mijazaki által alapított Studio Ghibli stílusában készült képek lepték el az internetet, szelfiktől kezdve a családi képeken át a híres történelmi fotókig mindent ghiblisítettek.
Csak pár példa:
Egy cuki családi fotó:
Itt mémeket alakítottak át:
Donald Trump pár emlékezetes jelenete az elmúlt időszakból:
És még Sam Altman, az OpenAI vezérigazgatója is lecserélte a profilképét:
Néhányan persze erőszakos témák ábrázolására is használták az új funkciót, például a 2001. szeptember 11-i terrortámadás megjelenítésére:
A Ghibli inspirálta AI-művészet korábban is népszerű volt, de az OpenAI mostani megoldása talán az eddigi legrealisztikusabban adja vissza Mijazaki stílusát, emiatt pedig újra fellángolt a szerzői jogokkal és az AI által készített lelketlen utánzatokkal kapcsolatos vita.
A kreatív területeken dolgozó írók, színészek, zenészek és képzőművészek egyre gyakrabban fejezik ki frusztrációjukat emiatt, tavaly például több mint 10 ezer színész és zenész, köztük Kazuo Ishiguro író, Julianne Moore színésznő és Thom Yorke, a Radiohead zenekar frontembere nyílt levélben bírálták az AI-cégeket, hogy a kreatív műveket engedély nélkül felhasználják a modellek fejlesztésére.
Maga Mijazaki is nagyon negatív véleménnyel volt a mesterséges intelligenciáról, egy 2016-os dokumentumfilmben egyenesen „az élet önmagában való megsértésének” nevezte azt. A klip a Ghibli-stílusú képek miatt azonnal terjedni kezdett az X-en. A filmben Mijazakinak megmutattak egy 3D-s modellt, aminek mozgását mesterséges intelligencia, nem pedig egy hús-vér animátor készítette. „Ha rá gondolok, képtelen vagyok ezt érdekesnek találni” – mondta Mijazaki, miután megnézte a videót, hozzátéve, hogy az egy fogyatékkal élő barátjára emlékezteti.
„Akik ilyesmit készítenek, fogalmuk sincs arról, mi az a fájdalom. Mélységesen felháborítónak találom. Ha valaki hátborzongató dolgokat akar létrehozni, tegye – de én soha nem kívánnék ilyen technológiát beépíteni a munkámba. Őszintén úgy érzem, hogy ez sértés magával az élettel szemben” – mondta.
Erik Hoel amerikai agykutató a Substacken egyenesen a jelentés apokalipsziséről írt (érdemes elolvasni az egész cikket, nagyon jó). „A ChatGPT nem képes tökéletesen lemásolni Mijazaki stílusát – de ez nem is számít. A szemantikai apokalipszishez nincs szükség arra, hogy az AI-műalkotások ugyanolyan jók legyenek, mint az emberiek. Elég, ha elárasztanak minket olyan alkotásokkal, amik »elég hasonlók«, hogy az eredeti elveszítse a jelentését” – fogalmazott, hozzátéve, hogy az AI-nak az utánzás a legfontosabb képessége. Hoel szerint az AI által generált termék úgy is kiváltja a hatást, ha nem teljesen tökéletes, ettől pedig a művészet valami üressé, jelentésétől megfosztottá válik.
„Ez az, amitől a leginkább tartok a mesterséges intelligenciával kapcsolatban – legalábbis a közeljövőben. Nem attól, hogy egy mindent felfaló szuperintelligencia jelenik meg (hiszen még a Pokémon játékot sem képes legyőzni, amit sokan már tízévesen végigjátszottunk), hanem egy sokkal kevésbé látványos apokalipszistől. Attól, hogy a kultúra ugyanarra a sorsra jut, mint a közösségek: összeomlik a Szilícium-völgyből áradó, zakatoló utánzatgyártás következtében. Egy olyan túltermeléstől, ami kulturális szinten lakat jól minket, mígnem teljesen elszakadunk a jelentéstől, és már csak a szerkezet olcsó csontvázát látjuk. Amikor ez lelepleződik, semmi közünk nem marad hozzá. Csak pixelek maradnak. Csak szótagok. Valamilyen sorrendben, igen – de kit érdekel?”
A 404Media cikke szerint az OpenAI korábban rendkívül szigorú biztonsági korlátozásokkal akadályozta meg, hogy a felhasználók valós személyekről és történelmi figurákról képeket készítsenek. A Ghibli-stílusú képek megjelenése azonban világosan mutatják, hogy a cég álláspontja megváltozott.
Az OpenAI közölte, hogy már nem tiltják a felnőtt közszereplők ábrázolását, ugyanakkor „ugyanazokat a biztonsági intézkedéseket alkalmazzák, amiket a fotorealisztikus képek szerkesztésekor is. Ennek célja, hogy a technológiát hasznos és értékes módon lehessen felhasználni, például oktatási, történelmi vagy szatirikus tartalmak készítésére.”
A cég szerint az új funkció csak kreatív asszisztensként szolgál, nem akarják a szerzői jogokat sérteni, azt írták: „Célunk, hogy a felhasználók számára minél nagyobb kreatív szabadságot biztosítsunk. Továbbra is megakadályozzuk az élő művészek stílusában készült képek generálását, de engedélyezzük a tágabb értelemben vett stúdióstílusokat – ezekből születtek igazán örömteli és inspiráló rajongói alkotások is”.
(New York Times, 404Media, Know Your Meme, The Intrinsic Perspective)