Rengeteg vicces, szép, látványos készül AI-jal, ami jól hangzik, az viszont már kevésbé, hogy ezek mindegyikéhez több száz, sőt esetenként több ezer joule energiára volt szükség. A mesterséges intelligenciával készült képek mögött ott a GPU-k sora, amelyek csak úgy falják az elektromosságot.

Úgy tűnik, van kiút ebből, legalábbis ezt állítják a Los Angeles-i Kaliforniai Egyetem szakemberei. A kutatók egy újszerű, mesterséges intelligencia alapú képgenerátort fejlesztettek, amely szinte semmilyen számítási kapacitást nem igényel, ehelyett a fény fizikáját használja a számításaihoz. Ez az új megközelítés drasztikusan csökkentheti a nagyméretű mesterséges intelligencia alapú tartalomkészítéssel járó karbonlábnyomot.

 „A digitális diffúziós modellekkel ellentétben, amelyek több száz vagy akár több ezer iteratív lépést igényelnek, a mi folyamatunk pillanatkép formájában generálja a képeket, így a kezdeti kódoláson túl nincs szükség további számításokra” – adnak magyarázatot a kutatók a meglepően csekély energiaszükségletre.

A „hagyományos”, mesterséges intelligencia által létrehozott képgenerátorok egy diffúziónak nevezett folyamatot használnak arra, hogy képet készítsenek szövegből. A mesterséges intelligenciát arra képezik ki, hogy „digitális statikus zajt” adjon egy képhez, amíg semmi felismerhető nem marad. Ezután a MI megtanulja, hogyan fordítsa vissza a folyamatot. A generatív mesterséges intelligencia betanítása során több millió, sőt milliárd kép megy keresztül ezen. Amikor új képet kérnek a MI-től, véletlenszerű statikus zajjal kezd, és lépésről lépésre távolítja el a zajt, amíg a kívánt kép létre nem jön. Eredményes, viszont lassú és számítás-, így energiaigényest folyamatról van szó.

A kutatók fényalapú megközelítése egészen más utat követ. Egy speciális digitális hálózat zajmintát generál, amelyet azután egy térbeli fénymodulátornak nevezett eszköz – egy konfigurálható folyadékkristályos képernyő – segítségével lézersugárra nyomtat. Ezt a mintázott fényt egy sor egyedi tervezésű optikai rétegen vezetik át, amelyek dekóderként működnek, és a zajt egy új, koherens képpé alakítják, teljesen optikailag.

Mesterséges intelligencia által generált műalkotások Vincent van Gogh stílusában. A bal szélső oszlopban látható képeket egy hagyományos, digitális MI-modell hozta létre. A középső és jobb oldali oszlop az új optikai MI eredményeit mutatja, a középső egy számítógépes szimulációt, a jobb oldali pedig a fénnyel létrehozott tényleges képeket

Nature

Azáltal, hogy az energiaigényes számításokat a fény optikai komponenseken keresztüli passzív átvitelével helyettesítik, a modell képeket szintetizál, miközben gyakorlatilag nem fogyaszt energiát a megvilágításhoz szükséges energián túl. „Optikai generatív modelljeink szinte számítási teljesítmény nélkül képesek számtalan képet szintetizálni, így skálázható és energiahatékony alternatívát kínálnak a digitális mesterséges intelligencia modellekhez képest” – állítja Shiqi Chen, a korábban a Nature-ben megjelent tanulmány vezető szerzője.

A kutatók különféle, mesterséges intelligencia modellek betanítására használt képeken tesztelték a rendszerüket. Az eredmények összehasonlíthatók voltak a hagyományos képgenerátorok eredményeivel, de sokkal kevesebb energiával készültek. Ez az áttörés jelentősen csökkentheti a mesterséges intelligencia által generált tartalmak szénlábnyomát.

A hatékonyság tehát rendben van, de mi van az adatvédelemmel? Nos, a szakemberek erre is gondoltak. Minden kép egyedi optikai fázismintázatban van kódolva, és csak a megfelelő dekóderfelület képes rekonstruálni a végső képet. Ez hozza létre az úgynevezett „fizikai kulcszár mechanizmust”, amely hasznos lehet a biztonságos kommunikáció vagy a hamisítás megakadályozása érdekében.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.