Бывает такое. Опять. Google презентует нечто грандиозное на конференции I/O, и заголовок обещает одно, а технологии показывают совершенно другое. Они называют его Gemini Omni. Звучит амбициозно. И это так. Но вот в чем подвох: компания хочет, чтобы вы поверили, что он создает «что угодно из чего угодно», однако демонстрация кричала об одном.
О видео.
И не просто о видеороликах, где красиво расставлены пиксели. Речь идет о видео, которое понимает окружающий мир. Gemini Omni Flash — это первый представитель в этой новой родословной.
Демис Хассабис не ходит вокруг да около. Он назвал это шагом к созданию AGI (общего искусственного интеллекта).
Большинство инструментов линейны: вы вводите текст, получаете клип. Скучно. Omni отличается тем, что принимает всё. Текст? Да. Аудио? Конечно. Изображения и видео в качестве входных данных тоже. Он перерабатывает этот мультимодальный хаос и выдает интерактивный мир, основанный на обучении Gemini с опорой на реальную действительность. Физика теперь работает лучше. Имеет значение исторический контекст. Если вы попросите показать Париж 1920-х годов, он случайно не оденет прохожего в современную спортивную форму.
Вдумайтесь в это. ИИ понимает шутку, а не просто обрабатывает запрос.
Монтаж здесь работает иначе. Забудьте пока о ключевых кадрах или масках слоев. Вы просто говорите. «Измени фон». Готово. «Смени ракурс». Готово. Неважно, сняли ли вы клип сами или это сделал ИИ — модель обрабатывает конкретные изменения без нервов и головной боли. Даже стиль и декорации подчиняются силе диалога.
Затем есть функция Аватар. Вы создаете цифровую копию себя. Звучит весело, правда?
Отчасти.
Google признает, что эта часть все еще в стадии тестирования. Ответственный запуск и все такое. Они опасаются — вероятно, справедливо — того, как быстро это должно выйти к широкой публике.
То, что выпущено сейчас, можно проверить бесплатно, но для серьезной работы стоит за закрытым шлюзом оплаты. Подписчики Google AI Plus, Pro и Ultra получают доступ сразу в приложении Gemini и Google Flow. Но что насчет остальных? Их не забыли.
На этой неделе функция появится в YouTube Shorts и приложении Create. Там бесплатно. Только стандартный водяной знак. Каждый сгенерированный клип несет метку SynthID, чтобы все знали, когда работу выполнила машина. Мы можем спорить об импликациях позже или прямо сейчас, но, честно говоря, это почти не имеет значения, когда результат выглядит так хорошо.
Инструмент уже работает. Водяной знак невидим глазу, но присутствует в коде. Мы наблюдаем, как миры создаются с нуля.






























