Google wprowadza nową sztuczną inteligencję, która tworzy światy, a nie tylko filmy

15

To się zdarza. Ponownie. Google prezentuje coś wielkiego na I/O i nagłówek obiecuje jedno, ale technologia ujawnia coś zupełnie innego. Nazywają to Gemini Omni. Brzmi ambitnie. I tak jest. Ale tu jest haczyk: firma chce, żebyś uwierzył, że tworzy „coś z czegokolwiek”, ale demo krzyczało jedno.

O filmie.

I nie chodzi tylko o filmy z pięknie rozmieszczonymi pikselami. Mówimy o filmie, który rozumie otaczający go świat. Gemini Omni Flash jest pierwszym członkiem tego nowego rodu.

Demis Hassabis nie owija w bawełnę. Nazwał to krokiem w stronę stworzenia AGI (sztucznej inteligencji ogólnej).

Większość narzędzi ma charakter liniowy: wprowadzasz tekst i otrzymujesz klip. Nudny. Omni jest inny, ponieważ akceptuje wszystko. Tekst? Tak. Audio? Z pewnością. Obrazy i filmy również jako dane wejściowe. Przetwarza ten multimodalny chaos w interaktywny świat oparty na uczeniu się opartym na rzeczywistości Gemini. Fizyka działa teraz lepiej. Kontekst historyczny ma znaczenie. Jeśli poprosimy o obejrzenie Paryża lat 20. XX wieku, z pewnością nie ubierze przechodnia w nowoczesny strój sportowy.

Pomyśl o tym. Sztuczna inteligencja rozumie żart, zamiast po prostu przetwarzać żądanie.

Edycja działa tutaj inaczej. Zapomnij na razie o klatkach kluczowych i maskach warstw. Po prostu rozmawiasz. „Zmień tło”. Gotowy. „Zmień perspektywę”. Gotowy. Nie ma znaczenia, czy klip nakręciłeś sam, czy zrobiła to sztuczna inteligencja – model przetwarza określone zmiany bez nerwów i bólów głowy. Nawet styl i sceneria są podporządkowane sile dialogu.

Następnie dostępna jest funkcja Awatar. Tworzysz cyfrową kopię siebie. Brzmi zabawnie, prawda?

Częściowo.

Google przyznaje, że ta część jest wciąż w fazie testów. Odpowiedzialny start i tyle. Obawiają się – prawdopodobnie słusznie – tego, jak szybko informacja musi dotrzeć do ogółu społeczeństwa.

To, co jest teraz wydawane, można sprawdzić za darmo, ale w przypadku poważnej pracy jest to za zamkniętą bramką płatniczą. Abonenci Google AI Plus, Pro i Ultra uzyskują natychmiastowy dostęp w aplikacji Gemini i Google Flow. Ale co z resztą? Nie zostały zapomniane.

Ta funkcja będzie dostępna w YouTube Shorts i aplikacji Utwórz w tym tygodniu. Tam jest za darmo. Tylko standardowy znak wodny. Każdy wygenerowany klip zawiera znacznik SynthID, dzięki czemu każdy wie, kiedy maszyna ukończyła zadanie. Możemy spierać się o konsekwencje później lub teraz, ale szczerze mówiąc, prawie nie ma to znaczenia, gdy wynik wygląda tak dobrze.

Narzędzie już działa. Znak wodny jest niewidoczny dla oka, ale jest obecny w kodzie. Obserwujemy, jak światy powstają od podstaw.