| Redaktion 

|
25.05.2025

Wir alle wissen um den rasanten Fortschritt generativer KI, der regelmäßig durch neue Anwendungen oder Updates vorangetrieben wird. Zwischen all den kleinen Schritten tun sich hin und wieder Weiterentwicklungen hervor, die unweigerlich wie ein Meilenstein anmuten – und genau das deutet sich gerade im Falle von Veo 3 an, dem neuesten KI-Videogenerierungsmodell von Google DeepMind.

Mitte des Monats beherbergte das Shoreline Amphitheatre in Mountain View, Kalifornien die Google I/O 2025. Ein Höhepunkt des Events war die Vorstellung von Veo 3, dem derzeit fortschrittlichsten KI-Videogenerierungsmodell von Google DeepMind. Sundar Pichai, CEO von Google, versprach, dass Veo 3 die Grenzen der Videoproduktion neu definiert, indem es hochrealistische Videos mit synchronem Audio erzeugt.

In der Tat imposante Demos auf der Bühne in Kalifornien folgten. Allerdings ist es häufig am interessantesten, was eifrige Nutzer in einem weniger durchorchestrierten Rahmen mit neuer Technologie anstellen können – und seit dem 20. Mai haben Abonnenten des Google AI Ultra-Abonnements (knapp 250 US-Dollar im Monat) die Möglichkeit, selbst mit Veo 3 zu experimentieren.

Die von Google hervorgehobene Synchronität im Audiobereich unterstreicht bislang vermutlich kein Uservideo besser als das oben eingebettete von X-Nutzer Ari Kuschnir, der laut Eigenangabe lediglich zwei Stunden für das Ergebnis gebraucht hat.

In zahlreichen unterschiedlichen Settings und Dynamiken demonstriert er die Fähigkeit KI-geschaffener „Darsteller“, realistisch anmutende Dialoge wiederzugeben, wobei der Klang mit der abgebildeten Zeitperiode harmoniert und auch die passenden Akzente offenbar keine Schwierigkeit für Veo 3 sind.

Ein Mann, ein Tag, ein Film: Das Ende aufwändiger Werbeproduktionen?

Die Zeiten, in denen Will Smith auf relativ krude Weise Spaghetti verzehrt hat, sind lange vorbei – und gleichzeitig erst etwas über zwei Jahre her. Welche Auswirkungen Veo 3 auf den Werbemarkt haben könnte, verdeutlicht X-User PJ Ace, der angibt, für eine halbe Million US-Dollar Werbeclips für die Pharmaindustrie gedreht zu haben.

Mit Veo-3-Credits im Wert von lediglich 500 US-Dollar habe er dieses Video erstellt, das trotz scherzhaftem Charakter und der einen oder anderen hölzern übermittelten Dialogzeile bestens als Proof of Concept geeignet ist:

Das Miete mehrerer geeigneter Locations, das Casten und Engagieren passender Darsteller, das Buchen einer Filmcrew, das Lichtequipment, Stunden im Schnitt und in der Post-Production und nicht zuletzt die Kreativagentur, die das Konzept des Spots erarbeitet hat: In einer von Gewinnmaximierung beherrschten Welt wäre es absolut naiv zu glauben, dass Unternehmen auf die Chance verzichten, diese Kostenpunkte zu streichen.

Das ist natürlich kein brandneuer Gedanke – allerdings wirkt er mit Veo 3 greifbarer denn je. Schon beim ersten Will-Smith-Spaghetti-Versuch war absehbar, wohin die Reise gehen würde, doch Bedenken um ganze Branchen ließen sich mit Verweis auf die mäßige Qualität der Resultate noch leichter als pessimistische Zukunftsmusik abtun.

Die Schwelle zur Scheinrealität

Inzwischen müssen Details, die ein Video als KI-generiert entlarven, immer häufiger akribisch gesucht werden. Wer davon ausgehend zum Beispiel an die eigene Elterngeneration denkt, wird sich ausmalen können, wie realistisch aktuellste Werke auf weite Teile der Bevölkerung wirken.

Das Überspringen dieser technologischen Schwelle ist (oder war) die notwendige Voraussetzung, um zahlreiche menschliche Faktoren mittelfristig kostensparend aus dem Schaffensprozess zu streichen.

Darüber hinaus müssen Unternehmen, die sich entsprechend ausrichten möchten, allerdings auch auf die Akzeptanz der Bevölkerung bauen. Die Chancen stehen nicht schlecht: Schon heute erfreuen sich auf YouTube beispielsweise KI-generierte „True“-Crime-Formate gewisser Beliebtheit, ohne dass diese dafür allzu tief in die audiovisuelle Trickkiste greifen müssten.

Einige Veo-3-Spielereien legen zudem nahe, dass sich Menschen in Zukunft schon früh daran gewöhnen, KI-generierte Fassungen bekannter Formate zu konsumieren: Insbesondere bei Jüngeren beliebter Hintergrund-Content wie Let’s Plays oder Straßen-Interviews (siehe das oben eingebettete, vom „Hawk Tuah Girl“ Haliey Welch inspirierte Video) könnte sich künftig mit einem Bruchteil des Aufwandes und wie am Fließband herstellen lassen.

Paradigmenwechsel mit offenen Fragen

Möglicherweise markiert Veo 3 also einen nachhaltig spürbaren Wendepunkt in der Welt der Videoproduktion. Während das Tool einerseits Kreativität entfesselt und Effizienz verspricht, wirft es andererseits tiefgreifende wirtschaftliche und gesellschaftliche Fragen aufwirft.

Die beeindruckenden Nutzerkreationen zeigen, dass die Technologie nicht nur Hollywood-Qualität in die Hände von Hobbyisten legt, sondern auch ganze Branchen – von der Werbung über die Filmproduktion bis zur Content Creation – vor eine ungewisse Zukunft stellt.

Die Möglichkeit, mit minimalem Aufwand realistische Videos samt täuschend echter Dialoge zu erstellen, senkt Produktionskosten dramatisch und erlaubt theoretisch nahezu jedem Menschen, eigene Anliegen beeindruckend zu veranschaulichen. Was man mit Fug und Recht als Demokratisierung der Videoproduktion feiern darf, wird gleichzeitig für viele leerbleibende Auftragsbücher sorgen.

Die bislang gern bemühte Aussage, dass sich „wirklich gute Anbieter immer durchsetzen werden“, verliert schlichtweg an Kraft, wenn Künstliche Intelligenz durch Tools wie Veo 3 Ergebnisse liefert, die selbst die bewährtesten Fachleute ins Schwitzen bringen – für ein Tausendstel der Kosten und innerhalb kürzester Zeit, wohlgemerkt. 

Wenn künftig jeder ein Filmemacher sein kann, wird die wahre Kunst womöglich darin liegen, Authentizität und Vertrauen in einer Flut von Scheinrealität zu bewahren.