A nova IA do Google constrói mundos, não apenas clipes

3

Isso acontece. De novo. O Google lança algo enorme no I/O e a manchete diz uma coisa, mas a tecnologia mostra outra. Eles chamam isso de Gêmeos Omni. Parece ambicioso. Isso é. Mas aqui está o truque: a empresa quer que você acredite que ela cria “qualquer coisa a partir de qualquer resultado”, mas a demonstração gritava uma mensagem.

Vídeo.

E especificamente, vídeo que entende o mundo. Não apenas pixels bem organizados. Gemini Omni Flash é o primeiro garoto desta nova árvore genealógica.

Demis Hassabis não mede palavras. Ele chamou isso de um passo em direção à AGI.

A maioria das ferramentas é linear. Você digita um texto e obtém um clipe. Tedioso. Omni é diferente porque aceita tudo. Texto, claro. Áudio? Sim. Imagens e vídeo como entrada também. Ele digere toda aquela bagunça multimodal e expõe um mundo interativo apoiado pelo treinamento de Gêmeos na realidade real. A física funciona melhor agora. O contexto histórico é importante. Se você perguntar pela Paris da década de 1920, não será por acaso que um pedestre será vestido com roupas esportivas modernas.

Pense nisso. A IA entende a piada, não apenas a mensagem.

A edição funciona de maneira diferente aqui. Esqueça os quadros-chave ou as máscaras de camada por um momento. Você apenas fala. “Mude o plano de fundo.” Feito. “Mude o ângulo.” Feito. Você gravou o clipe ou a IA fez isso, o modelo lida com as mudanças específicas sem você arrancar os cabelos. Até mesmo estilos e cenários se curvam à vontade da conversa.

Depois, há o recurso Avatar. Você cria uma imagem digital de si mesmo. Parece divertido, certo?

Mais ou menos.

O Google admite que ainda está testando essa parte. Lançamento responsável e tudo. Eles estão cautelosos, provavelmente com sabedoria, sobre a rapidez com que isso deve atingir o público em geral.

O que é lançado agora é gratuito para verificação, mas está bloqueado atrás de um acesso pago para o trabalho pesado. Os assinantes do Google AI Plus, Pro e Ultra obtêm-no imediatamente no aplicativo Gemini e no Google Flow. Mas as massas? Eles ainda não foram esquecidos.

Esta semana chega ao YouTube Shorts e ao aplicativo Criar. Não há nenhum custo lá. Apenas a marca d’água padrão. Cada clipe gerado carrega uma tag SynthID, então todos sabemos quando a máquina o produziu. Podemos discutir sobre as implicações mais tarde ou agora; francamente, isso pouco importa quando o resultado é tão bom.

A ferramenta está ativa. A marca d’água é invisível a olho nu, mas está presente no código. Estamos observando mundos sendo construídos do zero.