Google udostępnia Project Genie – interaktywne światy 3D z promptu w czasie rzeczywistym dla subskrybentów AI Ultra

Google udostępnia Project Genie – interaktywne światy 3D z promptu w czasie rzeczywistym dla subskrybentów AI Ultra Google DeepMind otworzyło dostęp do prototypu Project Genie, eksperymentalnego narzędzia, które pozwala tworzyć, eksplorować i modyfikować interaktywne wirtualne światy na podstawie tekstowego opisu lub przesłanych obrazów. Technologia korzysta z modelu świata Genie 3. Od 29 stycznia 2026 dostęp do prototypu otrzymują subskrybenci planu Google AI Ultra w USA. Generacja działa w czasie rzeczywistym przy 24 klatkach na sekundę w rozdzielczości 720p.

Google DeepMind udostępniło prototyp Project Genie, który pozwala użytkownikom planu Ultra tworzyć interaktywne wirtualne światy z promptu tekstowego lub obrazu w czasie rzeczywistym przy 24 FPS.

Veo 3.1 wprowadza tryb pionowy i rozdzielczość 4K. Google odpowiada tym na potrzeby twórców YouTube Shorts

Project Genie bazuje na modelu świata Genie 3, czyli zaawansowanym systemie sztucznej inteligencji, który generuje ścieżkę eksploracji na bieżąco, w miarę jak użytkownik porusza się po wirtualnym środowisku. W odróżnieniu od statycznych narzędzi do generowania wideo, jak OpenAI Sora czy Google Veo 3, Genie 3 tworzy dynamiczne, interaktywne symulacje, w których można poruszać się podobnie jak w grze. Model utrzymuje spójność wizualną przez kilka minut, zapamiętując elementy środowiska nawet po tym, gdy znikną z kadru. Użytkownik definiuje nie tylko wygląd świata, ale również perspektywę kamery, jak również sposób poruszania się, od chodzenia, przez jazdę, aż po lot.

AI Overviews Google’a podawało błędne informacje medyczne. Funkcja została wycofana z części zapytań

Prototyp Project Genie umożliwia trzy główne operacje. Po pierwsze, szkicowanie świata przy użyciu promptów tekstowych lub wygenerowanych obrazów, z możliwością podglądu i modyfikacji przy pomocy modelu Nano Banana Pro przed wejściem do środowiska. Po drugie, eksplorację w czasie rzeczywistym z pełną kontrolą kamery. Po trzecie, remiks istniejących światów, czyli możliwość budowania nowych wersji na bazie gotowych szablonów dostępnych w galerii. Wygenerowane sesje można pobierać jako wideo o długości do 60 sekund.

Google szykuje koniec zakupów, jakie znamy. Otwarty standard Universal Commerce Protocol zmieni wszystko w e-commerce

Jednak największy potencjał tej technologii tkwi nie w rozrywce, lecz w trenowaniu agentów AI. Google testowało już możliwości modelu z agentem SIMA, który realizował określone cele w wirtualnych środowiskach generowanych przez Genie 3. Zdolność do tworzenia nieograniczonej liczby zróżnicowanych scenariuszy sprawia, że ta technologia będzie niezwykle ważna dla rozwoju autonomicznych systemów, od robotyki po pojazdy autonomiczne, które mogą się uczyć w bezpiecznych, ale realistycznych symulacjach sytuacji zbyt rzadkich lub niebezpiecznych do odtworzenia w rzeczywistości.

Chrome z autonomicznym agentem AI. Auto Browse automatyzuje zakupy, rezerwacje i wypełnianie formularzy

Project Genie pozostaje projektem badawczym z wyraźnymi ograniczeniami. Maksymalny czas eksploracji wynosi 60 sekund, występują opóźnienia w sterowaniu, a generowane światy nie zawsze zachowują się zgodnie z prawami fizyki czy dokładnie realizują promptowe instrukcje. Funkcja promptowalnych zdarzeń, prezentowana podczas sierpniowej demonstracji Genie 3, jeszcze nie jest dostępna w prototypie. Google udostępnia narzędzie wyłącznie subskrybentom planu AI Ultra w USA, który kosztuje 249,99 dolarów miesięcznie (z rabatem 50 proc. na pierwsze trzy miesiące dla nowych użytkowników). Taka bariera cenowa wynika z ogromnej mocy obliczeniowej wymaganej przez generację w czasie rzeczywistym. Firma zapowiada jednak, że w przyszłości planuje rozszerzyć dostęp.

Źródło: Google DeepMind

Google udostępnia Project Genie – interaktywne światy 3D z promptu w czasie rzeczywistym dla subskrybentów AI Ultra

Tags: