{"id":375346,"date":"2025-08-26T20:08:19","date_gmt":"2025-08-26T20:08:19","guid":{"rendered":"https:\/\/www.europesays.com\/de\/375346\/"},"modified":"2025-08-26T20:08:19","modified_gmt":"2025-08-26T20:08:19","slug":"google-veroeffentlicht-ein-neues-ki-bildmodell-mit-deutlich-verbesserter-bildbearbeitung","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/de\/375346\/","title":{"rendered":"Google ver\u00f6ffentlicht ein neues KI-Bildmodell mit deutlich verbesserter Bildbearbeitung"},"content":{"rendered":"<p>                                    <a class=\"article-menu__content__link\" href=\"#summary\"><br \/>\n                        <img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/the-decoder.de\/resources\/icons\/summary.svg\" alt=\"summary\" width=\"27\" height=\"24\" data-no-lazy=\"1\"\/><br \/>\n                        Zusammenfassung<br \/>\n                    <\/a><\/p>\n<p><strong>Google Deepmind integriert ein neues Bildbearbeitungsmodell in die Gemini-App. Die Software ver\u00e4ndert Bilder auf Wunsch radikal und sorgt dennoch daf\u00fcr, dass Personen und Tiere erkennbar bleiben.<\/strong><\/p>\n<p>Google hat das neue Bild- und Editiermodell <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/developers.googleblog.com\/en\/search\/?product_categories=Gemini\">&#8222;Gemini 2.5 Flash Image Generation&#8220;<\/a> ver\u00f6ffentlicht. Es baut auf der <a href=\"https:\/\/the-decoder.de\/google-veroeffentlicht-native-sprachmodell-bildgenerierung-fuer-gemini\/\" target=\"_blank\" rel=\"noopener\">bisherigen nativen Gemini-Sprachmodell-Bildgenerierung<\/a> auf und verh\u00e4lt sich bei der Prompt-Umsetzung daher ziemlich genau, \u00e4hnlich wie <a class=\"mixed-keyword\" href=\"https:\/\/the-decoder.de\/openai-kuendigt-gpt-4o-als-neues-spitzenmodell-mit-audio-und-bildfunktionen-an\/\" target=\"_blank\" rel=\"noopener\">GPT-4o<\/a> von <a class=\"mixed-keyword\" href=\"https:\/\/the-decoder.de\/chatgpt-ist-ein-gpt-3-chatbot-von-openai-du-kannst-ihn-jetzt-testen\/\" target=\"_blank\" rel=\"noopener\">ChatGPT<\/a>, gerade im Vergleich zu reinen Bildmodellen mit geringerem Textverst\u00e4ndnis.<\/p>\n<p>Ein zentrales Merkmal von Gemini 2.5 Flash ist die sogenannte Charakterkonsistenz: Nutzer k\u00f6nnen eine Person, ein Objekt oder ein Tier \u00fcber verschiedene Bilder hinweg visuell konsistent darstellen \u2013 etwa in unterschiedlichen Posen, Umgebungen oder Lichtverh\u00e4ltnissen.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/flash_character_consitency.png\"><img data-lazyloaded=\"1\" fetchpriority=\"high\" decoding=\"async\" class=\"wp-image-43291 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/flash_character_consitency.png\" alt=\"\" width=\"1070\" height=\"623\"\/><\/a>Das neue Bildmodell kann Charaktere in verschiedenen Szenen darstellen. Ob die Funktion aufwendigere Fine-Tunings von Bildmodellen schl\u00e4gt, bleibt noch abzuwarten. | Bild: Google Deepmind<\/p>\n<p>Artikel teilen<\/p>\n<p>Empfiehl unseren Artikel weiter<\/p>\n<p>        Teilen<\/p>\n<p>Damit lassen sich etwa Bildreihen oder Produktabbildungen aus unterschiedlichen Perspektiven erstellen. Auch f\u00fcr einheitliche Markenbilder, Produktkataloge oder Mitarbeiterausweise ist das Modell laut Google einsetzbar.<\/p>\n<p>Anzeige<\/p>\n<p>THE DECODER Newsletter<\/p>\n<p>Die wichtigen KI-News direkt ins E-Mail-Postfach.<\/p>\n<p>\u2713 1x w\u00f6chentlich<\/p>\n<p>\u2713 kostenlos<\/p>\n<p>\u2713 jederzeit k\u00fcndbar<\/p>\n<p>Laut Google \u00fcbertrifft die neue Gemini-Bildgenerierung bei verschiedenen Bildbearbeitungsaufgaben bisher verf\u00fcgbare vergleichbare Bildsysteme teils deutlich.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini-image__image-editing__no_product-reconte.original-scaled.png\"><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43289 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini-image__image-editing__no_product-reconte.original-scaled.png\" alt=\"\" width=\"2560\" height=\"1440\"\/><\/a>Bild: Google<\/p>\n<p>Zudem erm\u00f6glicht das Modell pr\u00e4zise, lokal begrenzte Bearbeitungen per Texteingabe: Nutzer k\u00f6nnen ohne manuelle Auswahlwerkzeuge mit einem einfachen Prompt etwa den Hintergrund eines Fotos unscharf machen, Flecken entfernen, Farben hinzuf\u00fcgen oder komplette Objekte l\u00f6schen. Eine weitere <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/aistudio.google.com\/apps\/bundled\/pixshop\">Vorlagen-App namens &#8222;PixShop&#8220;<\/a> zeigt diese Bearbeitungsfunktionen mit UI- und Prompt-Steuerung.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini-2-5-flash-prompt-based-image-editing.original.png\"><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43296 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini-2-5-flash-prompt-based-image-editing.original.png\" alt=\"\" width=\"2298\" height=\"1278\"\/><\/a>Bild: Google Deepmind<br \/>\nBildkomposition, Stiltransfer und Weltwissen<\/p>\n<p>Gemini 2.5 Flash erlaubt es, bis zu drei Bilder miteinander zu verschmelzen. Dabei k\u00f6nnen Nutzer etwa ein Produktfoto und ein Raumfoto kombinieren, um fotorealistische Interior-Visualisierungen zu generieren. Auch komplexe Kompositionen mit mehreren Elementen lassen sich mit nur einem Prompt erzeugen. F\u00fcr diese &#8222;Multi-Image Fusion&#8220; stellt Google ein <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/aistudio.google.com\/apps\/bundled\/home_canvas\">interaktives Canvas-Tool<\/a> zur Verf\u00fcgung.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini_image_edit_demo-2.png\"><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43293 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini_image_edit_demo-2.png\" alt=\"\" width=\"867\" height=\"488\"\/><\/a>Bild: Google Deepmind<\/p>\n<p>Dar\u00fcber hinaus beherrscht das Modell stilistische Transformationen: Farbgebung, Textur oder Design eines Objekts lassen sich auf ein anderes \u00fcbertragen, wobei dessen Form und Details erhalten bleiben. Ein Kleid im Schmetterlingsmuster oder Gummistiefel mit Blumenstruktur sind typische Anwendungsbeispiele.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini_image_edit_style_transfer.png\"><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43294 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini_image_edit_style_transfer.png\" alt=\"\" width=\"876\" height=\"501\"\/><\/a>Bild: Google Deepmind<\/p>\n<p>Eine weitere F\u00e4higkeit ist das &#8222;Real-World Reasoning&#8220;: Das Modell kann einfache Kausalzusammenh\u00e4nge erfassen und visuell darstellen. In einem Beispiel erzeugt es zun\u00e4chst ein Bild eines Ballons, der auf einen Kaktus zufliegt und anschlie\u00dfend ein Folge\u00adbild, das die logische Konsequenz zeigt.<\/p>\n<p>Empfehlung<\/p>\n<p>                                            <a class=\"link-overlay\" href=\"https:\/\/the-decoder.de\/cloudflare-boss-matthew-prince-hat-keine-guten-nachrichten-fuer-das-www\/\" aria-label=\"Cloudflare-Boss Matthew Prince hat schlechte Nachrichten f\u00fcr das WWW\" target=\"_blank\" rel=\"noopener\"><\/p>\n<p>                                                        \t\t\t<a class=\"post-thumbnail\" href=\"https:\/\/the-decoder.de\/cloudflare-boss-matthew-prince-hat-keine-guten-nachrichten-fuer-das-www\/\" aria-hidden=\"true\" tabindex=\"-1\" target=\"_blank\" rel=\"noopener\"><\/p>\n<p>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" data-lazyloaded=\"1\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/chatbot_www_eating.png\" loading=\"lazy\" alt=\"Cloudflare-Boss Matthew Prince hat schlechte Nachrichten f\u00fcr das WWW\" width=\"375\" height=\"250\"\/><br \/>\n\t\t\t\t\t\t\t<\/a><\/p>\n<p>                \t\t\t<a class=\"post-thumbnail\" href=\"https:\/\/the-decoder.de\/cloudflare-boss-matthew-prince-hat-keine-guten-nachrichten-fuer-das-www\/\" aria-hidden=\"true\" tabindex=\"-1\" target=\"_blank\" rel=\"noopener\"><\/p>\n<p>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" data-lazyloaded=\"1\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/chatbot_www_eating.png\" loading=\"lazy\" alt=\"Cloudflare-Boss Matthew Prince hat schlechte Nachrichten f\u00fcr das WWW\" width=\"375\" height=\"250\"\/><br \/>\n\t\t\t\t\t\t\t<\/a><\/p>\n<p><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43292 size-medium\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/gemini_image_edit_demo-1-770x444.png\" alt=\"\" width=\"770\" height=\"444\"\/>Bild: Google Deepmind<\/p>\n<p>Diese semantischen F\u00e4higkeiten basieren auf dem Weltwissen von Gemini 2.5. Google veranschaulicht das anhand einer <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/aistudio.google.com\/apps\/bundled\/codrawing?showPreview=true&amp;showAssistant=true\">Mal-App, die Text-Instruktionen umsetzen kann<\/a>.<\/p>\n<p>F\u00fcr Endverbraucher und Entwickler verf\u00fcgbar<\/p>\n<p>Die neue Funktion ist ab sofort innerhalb der <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/gemini.google.com\/app\">Gemini-App<\/a> verf\u00fcgbar. Daf\u00fcr darf man allerdings nicht das Bildmodell &#8222;<a class=\"mixed-keyword\" href=\"https:\/\/the-decoder.de\/google-imagen-bild-ki-vs-dall-e-2\/\" target=\"_blank\" rel=\"noopener\">Imagen<\/a>&#8220; in der Bildleiste aktivieren, sondern muss bei den <a class=\"mixed-keyword\" href=\"https:\/\/the-decoder.de\/kuenstliche-intelligenz-begriffe-erklaerung\/\" target=\"_blank\" rel=\"noopener\">KI<\/a>-Bildmodellen oben links auf das &#8222;Flash&#8220;-Sprachmodell wechseln. Das ist zun\u00e4chst etwas verwirrend, aber insofern logisch, als es sich hier um eine native Bild-Editier-Funktion des Sprachmodells handelt.<\/p>\n<p><a href=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/flash_bildgenerierung.png\"><img loading=\"lazy\" data-lazyloaded=\"1\" decoding=\"async\" class=\"wp-image-43298 size-full\" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/flash_bildgenerierung.png\" alt=\"\" width=\"498\" height=\"355\"\/><\/a>Bild: Screenshot THE DECODER<\/p>\n<p>Hat man das Sprachmodell ausgew\u00e4hlt, kann man dem System ein Bild f\u00fcttern und Anweisungen geben, es zu ver\u00e4ndern. Alle in der Gemini-App bearbeiteten oder generierten Bilder enthalten ein sichtbares Wasserzeichen sowie das digitale Wasserzeichen<a href=\"https:\/\/the-decoder.de\/deepmind-hat-womoeglich-eine-loesung-fuer-das-ki-bild-problem\/\" target=\"_blank\" rel=\"noopener\"> SynthID, das unsichtbar im Bild verankert ist<\/a>.<\/p>\n<p><a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/ai.google.dev\/gemini-api\/docs\/image-generation\">Gemini 2.5 Flash Image<\/a> ist zudem als Vorschauversion \u00fcber die <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/ai.google.dev\/gemini-api\/docs\/image-generation\">Gemini API<\/a>, <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/aistudio.google.com\/prompts\/new_chat?model=gemini-2.5-flash-preview-image\">Google AI Studio<\/a> und <a target=\"_blank\" rel=\"noopener\" href=\"https:\/\/console.cloud.google.com\/vertex-ai\/studio\/multimodal?model=gemini-2.5-flash-image-preview\">Vertex AI<\/a> verf\u00fcgbar. Die Nutzung kostet 30 US-Dollar pro einer Million Output-Token. Ein Bild verbraucht im Schnitt 1.290 Token, was rund 0,039 US-Dollar pro Bild entspricht; derselbe Preis wie beim Vorg\u00e4ngermodell <a class=\"mixed-keyword\" href=\"https:\/\/the-decoder.de\/google-stellt-multimodales-ki-modell-gemini-2-0-mit-fokus-auf-agentische-ki-vor\/\" target=\"_blank\" rel=\"noopener\">Gemini 2.0 Flash<\/a> Image.<\/p>\n<p><img decoding=\"async\" class=\"wp-worthy-pixel-img skip-lazy \" src=\"https:\/\/www.europesays.com\/de\/wp-content\/uploads\/2025\/08\/cb145530484f4b04af7b6c35a4e191b0.gif\" loading=\"eager\" data-no-lazy=\"1\" data-skip-lazy=\"1\" height=\"1\" width=\"1\" alt=\"\"\/><\/p>\n","protected":false},"excerpt":{"rendered":"Zusammenfassung Google Deepmind integriert ein neues Bildbearbeitungsmodell in die Gemini-App. Die Software ver\u00e4ndert Bilder auf Wunsch radikal und&hellip;\n","protected":false},"author":2,"featured_media":375347,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[135],"tags":[101995,29,101996,30,4149,88242,190,189,194,191,193,192],"class_list":{"0":"post-375346","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-wissenschaft-technik","8":"tag-bild-ki","9":"tag-deutschland","10":"tag-gemini-2-5","11":"tag-germany","12":"tag-google","13":"tag-google-ai","14":"tag-science","15":"tag-science-technology","16":"tag-technik","17":"tag-technology","18":"tag-wissenschaft","19":"tag-wissenschaft-technik"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@de\/115096879810352396","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/375346","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/comments?post=375346"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/375346\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media\/375347"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media?parent=375346"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/categories?post=375346"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/tags?post=375346"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}