| Redaktion
|
25.05.2025
Wir alle wissen um den rasanten Fortschritt generativer KI, der regelmäßig durch neue Anwendungen oder Updates vorangetrieben wird. Zwischen all den kleinen Schritten tun sich hin und wieder Weiterentwicklungen hervor, die unweigerlich wie ein Meilenstein anmuten – und genau das deutet sich gerade im Falle von Veo 3 an, dem neuesten KI-Videogenerierungsmodell von Google DeepMind.
Mitte des Monats beherbergte das Shoreline Amphitheatre in Mountain View, Kalifornien die Google I/O 2025. Ein Höhepunkt des Events war die Vorstellung von Veo 3, dem derzeit fortschrittlichsten KI-Videogenerierungsmodell von Google DeepMind. Sundar Pichai, CEO von Google, versprach, dass Veo 3 die Grenzen der Videoproduktion neu definiert, indem es hochrealistische Videos mit synchronem Audio erzeugt.
In der Tat imposante Demos auf der Bühne in Kalifornien folgten. Allerdings ist es häufig am interessantesten, was eifrige Nutzer in einem weniger durchorchestrierten Rahmen mit neuer Technologie anstellen können – und seit dem 20. Mai haben Abonnenten des Google AI Ultra-Abonnements (knapp 250 US-Dollar im Monat) die Möglichkeit, selbst mit Veo 3 zu experimentieren.
WE CAN TALK! I spent 2 hours playing with Veo 3 @googledeepmind and it blew my mind now that it can do sound! It can talk, and this is all out of the box… pic.twitter.com/ufplpcZWbq
— Ari K (@arikuschnir) May 20, 2025
Die von Google hervorgehobene Synchronität im Audiobereich unterstreicht bislang vermutlich kein Uservideo besser als das oben eingebettete von X-Nutzer Ari Kuschnir, der laut Eigenangabe lediglich zwei Stunden für das Ergebnis gebraucht hat.
In zahlreichen unterschiedlichen Settings und Dynamiken demonstriert er die Fähigkeit KI-geschaffener „Darsteller“, realistisch anmutende Dialoge wiederzugeben, wobei der Klang mit der abgebildeten Zeitperiode harmoniert und auch die passenden Akzente offenbar keine Schwierigkeit für Veo 3 sind.
Ein Mann, ein Tag, ein Film: Das Ende aufwändiger Werbeproduktionen?
Die Zeiten, in denen Will Smith auf relativ krude Weise Spaghetti verzehrt hat, sind lange vorbei – und gleichzeitig erst etwas über zwei Jahre her. Welche Auswirkungen Veo 3 auf den Werbemarkt haben könnte, verdeutlicht X-User PJ Ace, der angibt, für eine halbe Million US-Dollar Werbeclips für die Pharmaindustrie gedreht zu haben.
Mit Veo-3-Credits im Wert von lediglich 500 US-Dollar habe er dieses Video erstellt, das trotz scherzhaftem Charakter und der einen oder anderen hölzern übermittelten Dialogzeile bestens als Proof of Concept geeignet ist:
I used to shoot $500k pharmaceutical commercials.
I made this for $500 in Veo 3 credits in less than a day.
What’s the argument for spending $500K now?
(Steal my prompt below 👇🏼) pic.twitter.com/4UH43EXDux
— PJ Ace (@PJaccetturo) May 22, 2025
Das Miete mehrerer geeigneter Locations, das Casten und Engagieren passender Darsteller, das Buchen einer Filmcrew, das Lichtequipment, Stunden im Schnitt und in der Post-Production und nicht zuletzt die Kreativagentur, die das Konzept des Spots erarbeitet hat: In einer von Gewinnmaximierung beherrschten Welt wäre es absolut naiv zu glauben, dass Unternehmen auf die Chance verzichten, diese Kostenpunkte zu streichen.
Das ist natürlich kein brandneuer Gedanke – allerdings wirkt er mit Veo 3 greifbarer denn je. Schon beim ersten Will-Smith-Spaghetti-Versuch war absehbar, wohin die Reise gehen würde, doch Bedenken um ganze Branchen ließen sich mit Verweis auf die mäßige Qualität der Resultate noch leichter als pessimistische Zukunftsmusik abtun.
Die Schwelle zur Scheinrealität
Inzwischen müssen Details, die ein Video als KI-generiert entlarven, immer häufiger akribisch gesucht werden. Wer davon ausgehend zum Beispiel an die eigene Elterngeneration denkt, wird sich ausmalen können, wie realistisch aktuellste Werke auf weite Teile der Bevölkerung wirken.
Das Überspringen dieser technologischen Schwelle ist (oder war) die notwendige Voraussetzung, um zahlreiche menschliche Faktoren mittelfristig kostensparend aus dem Schaffensprozess zu streichen.
Google Veo 3 realism just broke the Internet yesterday.
This is 100% AI
10 wild examples:
1. Street interview that never happened pic.twitter.com/qdxZVhOO3G
— Min Choi (@minchoi) May 22, 2025
Darüber hinaus müssen Unternehmen, die sich entsprechend ausrichten möchten, allerdings auch auf die Akzeptanz der Bevölkerung bauen. Die Chancen stehen nicht schlecht: Schon heute erfreuen sich auf YouTube beispielsweise KI-generierte „True“-Crime-Formate gewisser Beliebtheit, ohne dass diese dafür allzu tief in die audiovisuelle Trickkiste greifen müssten.
Einige Veo-3-Spielereien legen zudem nahe, dass sich Menschen in Zukunft schon früh daran gewöhnen, KI-generierte Fassungen bekannter Formate zu konsumieren: Insbesondere bei Jüngeren beliebter Hintergrund-Content wie Let’s Plays oder Straßen-Interviews (siehe das oben eingebettete, vom „Hawk Tuah Girl“ Haliey Welch inspirierte Video) könnte sich künftig mit einem Bruchteil des Aufwandes und wie am Fließband herstellen lassen.
Paradigmenwechsel mit offenen Fragen
Möglicherweise markiert Veo 3 also einen nachhaltig spürbaren Wendepunkt in der Welt der Videoproduktion. Während das Tool einerseits Kreativität entfesselt und Effizienz verspricht, wirft es andererseits tiefgreifende wirtschaftliche und gesellschaftliche Fragen aufwirft.
Die beeindruckenden Nutzerkreationen zeigen, dass die Technologie nicht nur Hollywood-Qualität in die Hände von Hobbyisten legt, sondern auch ganze Branchen – von der Werbung über die Filmproduktion bis zur Content Creation – vor eine ungewisse Zukunft stellt.
Before you ask: yes, everything is AI here. The video and sound both coming from a single text prompt using #Veo3 by @GoogleDeepMind .Whoever is cooking the model, let him cook! Congrats @Totemko and the team for the Google I/O live stream and the new Veo site! pic.twitter.com/sxZuvFU49s
— László Gaál (@laszlogaal_) May 21, 2025
Die Möglichkeit, mit minimalem Aufwand realistische Videos samt täuschend echter Dialoge zu erstellen, senkt Produktionskosten dramatisch und erlaubt theoretisch nahezu jedem Menschen, eigene Anliegen beeindruckend zu veranschaulichen. Was man mit Fug und Recht als Demokratisierung der Videoproduktion feiern darf, wird gleichzeitig für viele leerbleibende Auftragsbücher sorgen.
Die bislang gern bemühte Aussage, dass sich „wirklich gute Anbieter immer durchsetzen werden“, verliert schlichtweg an Kraft, wenn Künstliche Intelligenz durch Tools wie Veo 3 Ergebnisse liefert, die selbst die bewährtesten Fachleute ins Schwitzen bringen – für ein Tausendstel der Kosten und innerhalb kürzester Zeit, wohlgemerkt.
Wenn künftig jeder ein Filmemacher sein kann, wird die wahre Kunst womöglich darin liegen, Authentizität und Vertrauen in einer Flut von Scheinrealität zu bewahren.