Dank Veo 3 kannst du jetzt aus Fotos von deiner Umgebung lebensechte Videos machen. Mithilfe von Flow kannst du Bilder sogar sprechen lassen. Passend dazu weitet Google den Zugriff auf AI Ultra und Flow weltweit aus. Doch diese Art der Videokreation birgt auch große Risiken.
Veo 3 ist ein so eindrucksvolles KI-Videomodell, dass auf diversen Plattformen dieser Welt in den vergangenen Wochen zahlreiche AI-generierte Clips aus der Veo-Kreation viral gingen. Mehr als 40 Millionen Videos wurden bereits erstellt. Nachdem Google das Modell, welches kurze Videos mit Sound aus Prompts und Bildvorgaben erstellen kann, zuletzt in Deutschland launchte, haben auch hierzulande viele Creator und Marketer mit der Option gearbeitet. Jetzt können die Creator auch direkt Bilder in Videos umwandeln und den einst statischen Visuals sogar Sprache oder einen Dialog hinzufügen. Dank umfassender Verfügbarkeit haben inzwischen deutlich mehr Menschen weltweit Zugriff – sodass Veo 3 auch in naher Zukunft den Digitalraum mit sehr viel Content versorgen dürfte.
KI-Videos mit Sound jetzt in Deutschland
© Google Deutschland via Canva
Veo 3: Vom Bild zum Video, so geht’s
Im Mai erst launchte Google Veo 3 als Nachfolgeversion von Veo 2. Wenige Monate später ist das KI-Videomodell leistungsfähiger denn je. Das neueste Feature dürfte erneut für viele Kreationsexperimente sorgen. Denn ab jetzt lassen sich statische Bilder einfach in Videos verwandeln. Dazu erklärt Google:
Select ‘video‘ from the tool menu in the prompt box, upload a photo, then describe the scene and audio you imagine and watch as your still image transforms.
Damit dieser Prozess noch etwas greifbarer und visuell ansprechend deutlich wird, hat Google CEO Sundar Pichai auf X ein Beispielvideo veröffentlicht. Darin lässt er das Dinosaurierskelett, welches auf dem Google Campus als eine Art Maskottchen mit dem Namen Stan fungiert, einfach loslaufen – und brüllen.
Since I/O in May, you’ve created 40M+ videos with Veo 3!
Now our new photo to video feature in the @Geminiapp lets you create clips inspired by the world around you. Here’s how I imagine our resident dino Stan roams the Google campus when we’re not looking:) Ultra/Pro… pic.twitter.com/2VBirMyFtO
— Sundar Pichai (@sundarpichai) July 10, 2025
Diese besondere Funktion ist ab sofort für Abonnent:innen von Google AI Ultra und Pro verfügbar, zunächst aber nur in ausgewählten Ländern. Testen können Creator das Feature via gemini.google.com. In Deutschland ist es schon zu nutzen. Der KI-Experte Jens Polomski zeigt auf LinkedIn seine Kreation, die aus Bildern Videos hervorbringt.
Passend zur Ankündigung dieser kreativen Neuerung hat Google ebenfalls verkündet, dass Google AI Ultra in 76 weitere Länder kommt und in über 140 Ländern verfügbar sein wird. Überdies wird der Zugriff auf Flow auf noch mehr Länder ausgeweitet. Eine Übersicht der Länder, in denen du das Filmmaking Tool nutzen kannst, findest du auf Googles Hilfeseite – Deutschland ist mit dabei.
The best of Google AI is coming to more people 🌎
🧑💻 Google AI Ultra is expanding to 76 more countries, meaning over 140 countries now get the highest access to the best of Google AI including Veo 3 in the @GeminiApp.
🎞️ Flow is also coming to more places, and we’re… pic.twitter.com/1bVTEAhtCR
— Google (@Google) July 10, 2025
Mit Flow können User den zu Videos animierten Bildern einfach einen passenden Sound und sogar Monolog oder Dialog hinzufügen.
You know that saying „a picture speaks a thousand words“? Now it… can!
In addition to being able to upload images to use in your Flow videos, you can also add speech to the images you upload. Get your pet ready for its close-up and a monologue 🎬
Audio generation on Flow is… pic.twitter.com/6g9Jx67OA6
— Google Labs (@GoogleLabs) July 10, 2025
Veo 3 hat Riesenpotential und birgt ein enormes Risiko
Bei bestimmten Fotos soll die Animation und Sound-Unterlegung laut Google jedoch nicht möglich sein. Das könnte ein Hinweis auf die Sicherheitsmaßnahmen des Unternehmens sein. Immerhin betont Google, dass man etwaigen Missbrauch des Tools bereits mit Red Teaming vorbeugen wolle und dass man die Content-Richtlinien – etwa zu gewaltvollen oder explizit sexuellen Inhalten – streng überwache. Auch werden alle mit Veo 3 generierten Videos mit dem SynthID-Wasserzeichen versehen und als KI-generiert gekennzeichnet. Dennoch besteht die Gefahr, dass die simple Umwandlung von Fotos in Videos mit Sound von einigen für unlautere Zwecke eingesetzt wird. Eine reihe rassistischer und sexistischer Videos ist mithilfe des Modells bereits in Umlauf gekommen.
Mit jeder technologischen Neuerung größeren Ausmaßes für die KI-Kreation gehen derlei Risiken einher, deren Auswirkungen als Gegengewicht zum großen Potential der Funktionen noch kaum zu ermessen sind. Derweil optimiert Google die eigene Sucherfahrung ebenfalls mit Nachdruck und bringt beispielsweise den AI Mode in die visuelle Suche mit Circle to Search – ein Tool, das auch für Videos eingesetzt werden kann, künftig wohl auch für KI-Videos.
Googles AI Mode kommt zu Circle to Search
Niklas Lewanczik ist studierter Literatur- und Medienwissenschaftler und schreibt für OnlineMarketing.de seit Jahren über diverse Themen im Digital-Marketing-Bereich. Von der Mobile-First-Indexierung über die DSGVO bis hin zum Aufstieg von TikTok hat er schon manche Entwicklung der Branche begleitet.