A DeepMind, laboratório de investigação IA da Google, revelou o Genie 3, um modelo de inteligência artificial generativa que não se limita a produzir imagens ou vídeos: cria verdadeiros mundos virtuais com persistência, coerência e interactividade. Em poucos segundos, o sistema é capaz de gerar ambientes tridimensionais com resolução de 720p e fluidez de 24 fotogramas por segundo, nos quais o utilizador pode circular livremente e interagir com os objectos. Um género de cenário 3D de um jogo, gerado a partir de descrições de texto feitas pelo utilizador.

Mais do que um salto gráfico, trata-se de uma evolução estrutural. Ao contrário de abordagens anteriores, onde os cenários se desintegravam em segundos, o Genie 3 mantém os elementos no lugar durante vários minutos, mesmo que o ponto de vista se altere. A consistência espacial e temporal do ambiente é uma das marcas deste avanço. Os objectos não desaparecem nem se reorganizam arbitrariamente — permanecem, resistem ao tempo, comportam-se como parte de um espaço coeso.

Outro traço diferenciador é a capacidade de modificar os mundos em tempo real. Através de simples comandos em linguagem natural, é possível alterar o estado do tempo, adicionar elementos ou redesenhar o ambiente — tudo isto sem reiniciar a simulação. E o mais curioso: esta coerência não resulta de um conjunto de regras codificadas manualmente. É uma propriedade emergente do próprio modelo, treinado com milhões de exemplos visuais.

Só para alguns

Nesta fase, o Genie 3 continua a ser uma tecnologia em desenvolvimento, acessível apenas a um grupo restrito de investigadores e criadores. Há ainda limitações claras: as interacções são básicas, não há suporte para múltiplos utilizadores em simultâneo, e continua a ser impossível criar réplicas detalhadas do mundo real ou texto legível dentro das simulações. Além disso, os cenários têm uma duração pensada para minutos — não para longas sessões de exploração.

Apesar disso, a DeepMind vê neste projecto uma ferramenta promissora para o treino de outros sistemas de inteligência artificial. Ao permitir que agentes experimentem, falhem e aprendam em ambientes sintéticos, o Genie 3 poderá tornar-se uma peça fundamental na construção de inteligências artificiais mais gerais, capazes de lidar com contextos complexos e dinâmicos.