Google spouští novou umělou inteligenci, která vytváří světy, nejen videa

12

To se stává. Znovu. Google na I/O odhaluje něco velkého a titulek slibuje jednu věc, ale technologie odhaluje něco úplně jiného. Říkají tomu Gemini Omni. Zní to ambiciózně. A tak to je. Ale tady je háček: společnost chce, abyste věřili, že vytváří „cokoli z čehokoli“, ale demo křičelo jednu věc.

O videu.

A nejen o videích s krásně uspořádanými pixely. Mluvíme o videu, které rozumí světu kolem sebe. Gemini Omni Flash je prvním členem této nové krevní linie.

Demis Hassabis se nemlátí do křoví. Nazval to krokem k vytvoření AGI (umělá obecná inteligence).

Většina nástrojů je lineárních: zadáte text, získáte klip. Nudný. Omni je jiný, protože přijímá vše. Text? Ano. Zvuk? Jistě. Obrázky a videa také jako vstup. Destiluje tento multimodální chaos do interaktivního světa založeného na učení Gemini založeném na realitě. Fyzika teď funguje lépe. Historický kontext je důležitý. Pokud ho požádáte, abyste se podívali do Paříže dvacátých let minulého století, neobleče náhodně kolemjdoucího do moderní sportovní uniformy.

Přemýšlejte o tom. Umělá inteligence rozumí vtipu, místo aby jednoduše zpracovala požadavek.

Úpravy zde fungují jinak. Na klíčové snímky nebo masky vrstev prozatím zapomeňte. Jen mluvíš. “Změňte pozadí.” Připraveno. “Změňte svůj pohled.” Připraveno. Nezáleží na tom, zda jste klip natočili sami, nebo to udělala umělá inteligence – model zpracovává konkrétní změny bez nervů a bolestí hlavy. Dokonce i styl a prostředí jsou podřízeny síle dialogu.

Pak je tu funkce Avatar. Vytváříte digitální kopii sebe sama. Zní to zábavně, že?

Částečně.

Google přiznává, že tato část je stále ve fázi testování. Odpovědné spuštění a to vše. Jsou opatrní – pravděpodobně oprávněně – ohledně toho, jak rychle se musí dostat k široké veřejnosti.

To, co je nyní uvolněno, lze zkontrolovat zdarma, ale pro seriózní práci je to za zavřenou platební bránou. Předplatitelé Google AI Plus, Pro a Ultra získají okamžitý přístup v aplikaci Gemini a Google Flow. Ale co zbytek? Nebyli zapomenuti.

Tato funkce přichází tento týden do YouTube Shorts a do aplikace Create. Je to tam zdarma. Pouze standardní vodoznak. Každý vygenerovaný klip nese značku SynthID, takže každý ví, kdy stroj dokončil úlohu. O důsledcích se můžeme dohadovat později nebo právě teď, ale upřímně řečeno, je téměř jedno, kdy výsledek vypadá tak dobře.

Nástroj již funguje. Vodoznak je okem neviditelný, ale v kódu je přítomen. Sledujeme, jak se světy vytvářejí od nuly.