La nueva IA de Google construye mundos, no sólo clips

6

Sucede. De nuevo. Google lanza algo enorme en I/O y el titular dice una cosa pero la tecnología muestra otra. Lo llaman Géminis Omni. Suena ambicioso. Es. Pero aquí está el truco: la compañía quiere que creas que crea “cualquier cosa a partir de cualquier resultado”, pero la demostración gritaba un mensaje.

Video.

Y concretamente, vídeo que entienda el mundo. No sólo píxeles bien dispuestos. Gemini Omni Flash es el primer niño del bloque en este nuevo árbol genealógico.

Demis Hassabis no se anda con rodeos. Lo llamó un paso hacia AGI.

La mayoría de las herramientas son lineales. Escribes texto y obtienes un clip. Aburrido. Omni es diferente porque lo acepta todo. Texto, claro. ¿Audio? Sí. Imágenes y videos como entrada también. Digiere todo ese lío multimodal y escupe un mundo interactivo respaldado por el entrenamiento de Gemini en la realidad real. La física funciona mejor ahora. El contexto histórico importa. Si preguntas por el París de los años 20, no es casualidad que un peatón se vista con ropa deportiva moderna.

Piensa en eso. La IA capta el chiste, no sólo el aviso.

La edición funciona de manera diferente aquí. Olvídate de los fotogramas clave o las máscaras de capa por un momento. Sólo habla. “Cambiar el fondo”. Hecho. “Cambia el ángulo”. Hecho. Tú filmaste el clip o lo hizo la IA, el modelo maneja los cambios específicos sin que te arranques el pelo. Incluso los estilos y los paisajes se someten a la voluntad de la conversación.

Luego está la función Avatar. Creas una imagen digital de ti mismo. Suena divertido, ¿verdad?

Más o menos.

Google admite que todavía está probando esa parte. Lanzamiento responsable y todo. Son cautelosos, probablemente con razón, sobre la rapidez con la que esto debería afectar al público en general.

Lo que se publica ahora se puede comprobar de forma gratuita, pero está bloqueado detrás de un muro de pago para el trabajo pesado. Los suscriptores de Google AI Plus, Pro y Ultra lo obtienen en la aplicación Gemini y en Google Flow de inmediato. ¿Pero las masas? Aún no están olvidados.

Esta semana lo trae a YouTube Shorts y a Crear aplicación. Allí no hay cargos. Sólo la marca de agua estándar. Cada clip generado lleva una etiqueta SynthID, por lo que todos sabemos cuándo lo creó la máquina. Podemos discutir sobre las implicaciones más adelante o ahora, francamente, poco importa cuando el resultado sea tan bueno.

La herramienta está activa. La marca de agua es invisible a la vista pero está presente en el código. Estamos viendo cómo se construyen mundos desde cero.