Vi sjekket hva Geminis bilderedigering kan – og ikke kan.
Google har lansert en ny bilderedigeringsmodell i Gemini-appen. De hevder at den nye modellen, kjent som, «Nano Banana», skal klare å gjøre store endringer på bilder med personer og dyr i dem, men skal fortsatt se ut som personene på originalbildet.
Selskapet lanserte muligheten for å redigere bilder gjennom Gemini tidligere i år, men nå lover de at den nye modellen skal være mye flinkere på å beholde trekkene til personene som er på bildene.
Tanken er at du kan laste opp et bilde av deg selv, et familiemedlem eller venner og be Gemini endre på hvor dere er, hva dere har på dere eller hva dere gjør.
KameraJan Sarzuelo Dydland / Tek.no
«Lag et bilde av denne personen med kjole på»
Så klart måtte vi prøve å se hvor langt man kunne ta disse bildeendringene. Og førsteinntrykket er at AI-en er ganske imponerende, men den er langt ifra perfekt.
Vi starter med referansebildet. Ifølge Google trenger du kun et bilde av en person og fortelle Gemini hva du vil den skal gjøre med bildet.
De bruker eksempler som «gjør at denne personen er en tyrefekter i en arena» eller « … i en sitcom fra 90-tallet».
Så jeg lastet opp en selfie av meg selv og ba chatboten lage bilder av meg i forskjellige situasjoner.
Se resultatene under:
Resultatene er enten eller. Noen ganger klarer AI-en å bevare ansiktet mitt. Men for det meste, ser jeg ut som en annen person.
Den liker også å plassere subjektet langt unna «kameraet», og gi meg hode- og ansiktsplagg som dekker til ansiktet. Så det er litt vanskelig å se om det faktisk er likt eller ikke.
Men bildene er likere meg enn hva for eksempel ChatGPT klarer å generere.
Se hva ChatGPT genererte da jeg spurte om å lage et bilde av meg som fallskjermhopper.
ChatGPT går mye nærmere, men mister en del av kjennetegnene til ansiktet mitt.
KameraGenerert av ChatGPT
Gemini skal også klare å ta informasjon fra flere bilder og sette dem sammen.
Eksempelet Google bruker er å ta et bilde av en person og et bilde av en hund og be AI-en lage et nytt bilde der de koser.
Jeg måtte prøve det samme med min kusines hund, Ellie.
Igjen, det genererte bildet liker å plassere oss langt unna kameraet. Og jeg vil ikke si at det ser ut som meg, selv om det er noen trekk som kjennes igjen. Men Ellie ser skummelt lik ut.
Synes du de AI-genererte bildene lignet på den ekte personen?
Det var mange bilder Gemini ikke ønsket å generere. Den nektet å generere et bilde av meg som en journalist i en pressekonferanse eller i militæruniform.
Noen ganger gikk det greit å generere meg som en politikonstabel, mens andre ganger sa den at det ikke var greit. Det samme gjaldt å lage et bilde av meg som en drag queen.
Gemini ville heller ikke generere bilder av meg som en undertøymodell, i bar overkropp på stranden eller med skytevåpen. Det er fordi den ønsker å unngå å lage skadelig eller seksualisert innhold, etter masse bråk rundt deepfake-porno av kjendiser.