Van ez az agyonhypeolt [DALL-E](https://openai.com/dall-e-2/)

Jópofa dolog ez az AI-os képgenerálás. De az első eredményeim mind minőségben mind vállalhatóságban erőssen eltérnek a felrakott példáktól. Úgy érzem, erőssen ferdít az oldal, vagy csak gyengébb változatot kapnak az “ingyenélők”. De az is benne van a pakliban, hogy a főoldalra kirakott képek a sokadik finomított keresés eredményei.

Az én eredményeim:

*”high quality comic book cover of a superhero mouse driving a spaceship”*
\- Űrhajó helyett versenyautó
\- kiválló minőség helyett ugyan színes, de kivállónak túlzással se mondható
\- valószínúleg a cover szó miatt értelmetlen címfeliratok (érdekesség, hogy a “A comic book cover of a superhero wearing headphones”-nál nincs egy betű sem)

*“drawing of all the characters of morse abc where the characters are leaves”*
\- nem érti mi az a morse, sima angol abc-t vesz alapul
\- mintha nem értené, hogy mit jelent az a szó, hogy összes, kihagy karaktereket
\- pár betűt visszaad levélként, de abból sincs köszönet

*“photorealistic image about Egyptian pyramid in Antoni Gaudí style”*
\- a fotórealisztikustól nagyon messze áll mind a 4 példakép
\- arra voltam kíváncsi, hogy milyen lenne a piramis, ha Gaudí készítené. Ehhez képest kb. sima piramisokat látok, amiben nincs semmi Gaudís stílusjegy.

Tetszik, hogy itt tart az AI, és hellyel-közzel egész jól felfogja, hogy mire gondol a “költő”.

Nektek milyen tapasztalataitok vannak?
Azoknak akik rendelkeznek vásárolt kreditekkel is: Ti jobb minőségű képeket kaptok?
Biztos vannak szóösszetételek, kerülendő kifejezések, …stb amivel pontosabb eredményeket lehet elérni. Vannak erre trükkök?

9 comments
  1. Sok AI programot kipróbáltam, a Dall-e szerintem erősen túlhypeolt. Próbáld ki a nightcafe.studio-t, nekem sokkal jobban bejött.

  2. Ezeknél a rajzolgatós ai-knál nekem mindig eszembe jutnak Asimov robottörténetei, ahol az embereknek nagyon pontos utasításokat kellett adni a robotok számára, hogy azok jól végrehajtsák a feladatokat. Elég jól tippelt szerintem az öreg ezzel kapcsolatban is, kb. 70 évvel ezelőtt.

  3. > “drawing of all the characters of morse abc where the characters are leaves”
    – nem érti mi az a morse, sima angol abc-t vesz alapul

    Hát így nem is fogja érteni, mert angolul morse code, nem morse abc (wtf???).

  4. *high quality comic book cover of a superhero mouse driving a spaceship*

    Itt több probléma is létezik a kéréssel kapcsolatban.

    1. Űrhajó helyett versenyautó — A driving szót nem igazán használjuk arra, hogy ha egy űrhajót vezetsz az inkább piloting. A driving-ból alapból gondolhat rögtön egy autóra és mivel a spaceship késöbb jön értelmetlennek tarthatja. Valamint a spacecraft úgyszintén egy jobb leíró szó a spaceship helyett.
    2. Másodikra nem tudom teljesen jó megolfást, csak próbálkozni lehet.
    3. “covert art” lenne a helyes kifejezés ha nem kellenek a feliratok.

    *drawing of all the characters of morse abc where the characters are leaves*

    1. morse code abc vagy international morse code lenne a helyesebb kifejezés.
    2. túl specifikálni is lehet dolgokat. Megérne egy próbát úgy, hogy “drawing of the morse code abc”.

    *“photorealistic image about Egyptian pyramid in Antoni Gaudí style”*

    talán “photorealistic image of a pyramid built in the style of Antoni Gaudí”

    Edi: Vagy akár “photorealistic, pyramid, Antoni Gaudí” Felsorolást sokszor jobban értenek mint összetett mondatokat.

    Nagyon sok esetben iszonyatosan számít ám egy AI esetében, hogy hogyan épül fel a mondatod és milyen szavakat használsz, mert az AI nem biztos, hogy érti a “konyha nylevű” leírásokat lásd driving – piloting.

  5. Én lokál futtatott stable-diffusionnel szoktam szórakozni. Huggingface-n sokféle modell érhető el hozzá, nem kell túlságosan érteni se hozzá, hogy pár dolgot beállíts.

    Az hogy milyen kontextust “ismer fel” az AI, nagyban modell függő is, meg fontos, hogy tudjuk, hogy technikailag nem érti azt amit leírunk neki.

  6. Oké, angolból lehet hogy kegyelem kettest kapnék, nem tagadom, vannak hiányosságaim. Szinte biztos voltam benne, hogy ebbe bele fogtok kötni. 🙂 A nyelvtannácik bezzeg sem a képek minőségéről sem a DALL-E-ról nem írtak. Nem mellesleg ez nem csak az én hibám, lusta voltam utánajárni, google translate azt copy.

    Szerencsére vannak itt hasznos hozzászólások is, köszi a tippeket!

Leave a Reply