Succede. Ancora. Google lancia qualcosa di enorme all’I/O e il titolo dice una cosa ma la tecnologia ne mostra un’altra. Lo chiamano Gemini Omni. Sembra ambizioso. È. Ma ecco il trucco: l’azienda vuole farti credere che crea “qualsiasi cosa da qualsiasi output”, eppure la demo lanciava un messaggio.
Video.
E nello specifico, video che capiscono il mondo. Non solo pixel disposti bene. Gemini Omni Flash è il primo bambino in questo nuovo albero genealogico.
Demis Hassabis non usa mezzi termini. Lo ha definito un passo verso l’AGI.
La maggior parte degli strumenti sono lineari. Digiti il testo e ottieni una clip. Noioso. Omni è diverso perché accetta tutto. Testo, certo. Audio? SÌ. Anche immagini e video come input. Digerisce tutto quel pasticcio multimodale e sputa fuori un mondo interattivo supportato dalla formazione di Gemini sulla realtà reale. La fisica funziona meglio adesso. Il contesto storico conta. Se chiedi la Parigi degli anni ’20, non vestirà accidentalmente un pedone con abiti sportivi moderni.
Pensaci. L’intelligenza artificiale capisce lo scherzo, non solo il suggerimento.
La modifica funziona diversamente qui. Dimentica per un momento i fotogrammi chiave o le maschere di livello. Tu parli e basta. “Cambia lo sfondo.” Fatto. “Cambia l’angolazione.” Fatto. Sei stato tu a girare la clip o l’ha fatto l’intelligenza artificiale, il modello gestisce le modifiche specifiche senza che ti strappi i capelli. Anche gli stili e le scenografie si piegano alla volontà della conversazione.
Poi c’è la funzione Avatar. Crei una somiglianza digitale di te stesso. Sembra divertente, vero?
Più o meno.
Google ammette che sta ancora testando quella parte. Lancio responsabile e tutto il resto. Sono cauti, probabilmente saggiamente, sulla rapidità con cui ciò dovrebbe colpire il grande pubblico.
Ciò che viene rilasciato ora può essere controllato gratuitamente ma bloccato dietro un muro a pagamento per il lavoro pesante. Gli abbonati a Google AI Plus, Pro e Ultra lo ricevono subito nell’app Gemini e in Google Flow. Ma le masse? Non sono ancora stati dimenticati.
Questa settimana è disponibile su YouTube Shorts e sull’app Crea. Nessun addebito lì. Solo la filigrana standard. Ogni clip generato porta un tag SynthID, quindi sappiamo tutti quando la macchina lo ha realizzato. Possiamo discutere delle implicazioni più tardi o adesso, francamente non ha molta importanza quando il risultato è così buono.
Lo strumento è attivo. La filigrana è invisibile agli occhi ma presente nel codice. Stiamo osservando mondi che vengono costruiti da zero.






























