La nouvelle IA de Google crée des mondes, pas seulement des clips

22

Cela arrive. Encore. Google laisse tomber quelque chose d’énorme au niveau des E/S et le titre dit une chose mais la technologie en montre une autre. Ils l’appellent Gemini Omni. Cela semble ambitieux. C’est. Mais voici l’astuce : la société veut vous faire croire qu’elle crée « n’importe quoi à partir de n’importe quelle sortie », alors que la démo criait un message.

Vidéo.

Et plus précisément, une vidéo qui comprend le monde. Pas seulement des pixels bien disposés. Gemini Omni Flash est le premier enfant de ce nouvel arbre généalogique.

Demis Hassabis ne mâche pas ses mots. Il a appelé cela une étape vers l’AGI.

La plupart des outils sont linéaires. Vous tapez du texte, obtenez un clip. Ennuyeux. Omni est différent car il accepte tout. Un texto, bien sûr. Du son ? Oui. Images et vidéo en entrée également. Il digère tout ce désordre multimodal et crache un monde interactif soutenu par la formation de Gemini sur la réalité réelle. La physique fonctionne mieux maintenant. Le contexte historique compte. Si vous recherchez le Paris des années 1920, ce n’est pas par hasard que vous habillerez un piéton avec des vêtements de sport modernes.

Pensez-y. L’IA comprend la blague, pas seulement l’invite.

L’édition fonctionne différemment ici. Oubliez les images clés ou les masques de calque pendant un moment. Tu parles juste. “Changer l’arrière-plan.” Fait. “Changez l’angle.” Fait. Vous avez tourné le clip ou l’IA l’a fait, le modèle gère les changements spécifiques sans que vous vous arrachiez les cheveux. Même les styles et les paysages se plient au gré de la conversation.

Ensuite, il y a la fonctionnalité Avatar. Vous créez une ressemblance numérique de vous-même. Ça a l’air amusant, non ?

Sorte de.

Google admet qu’il teste toujours cette partie. Lancement responsable et tout. Ils se méfient, probablement à juste titre, de la rapidité avec laquelle cela devrait toucher le grand public.

Ce qui est publié maintenant est gratuit à vérifier, mais verrouillé derrière un paywall pour le gros du travail. Les abonnés Google AI Plus, Pro et Ultra l’obtiennent immédiatement dans l’application Gemini et Google Flow. Mais les masses ? Ils ne sont pas encore oubliés.

Cette semaine, c’est disponible sur YouTube Shorts et sur l’application Create. Pas de frais là-bas. Juste le filigrane standard. Chaque clip généré porte une balise SynthID, nous savons donc tous quand la machine l’a créé. Nous pourrons discuter des implications plus tard ou maintenant, franchement, cela n’a guère d’importance lorsque le résultat est aussi bon.

L’outil est en direct. Le filigrane est invisible à l’oeil mais présent dans le code. Nous voyons des mondes se construire à partir de zéro.