Gemini Omni: видео из любого материала и редактирование голосом
На I/O 2026 Google представила Gemini Omni — новую модель, которая умеет создавать и редактировать видео из любого набора входных данных. Глава DeepMind Демис Хассабис описал ее одной фразой: «наша новая модель, которая может создать что угодно из любого входного материала».
Что это такое и чем отличается от Veo
До Omni у Google уже была линейка видеомоделей Veo. Она умела генерировать красивые кинематографичные клипы из текстовых описаний, но на этом её возможности в основном заканчивались. Veo имеет преимущество в качестве одиночного кадра кинематографического уровня, но ограничена в мультимодальных входных данных и разговорном редактировании.
Omni решает именно эту проблему. Google перенесла усилия по генерации видео из отдельной линейки Veo в основную систему Gemini. Пользователи могут комбинировать изображения, аудио, видео и текст в одном запросе — модель не склеивает эти входные данные между собой, а рассуждает через них целиком и производит единый результат, затем принимает дальнейшие правки через разговор.
Официально Google подтвердила: Gemini Omni заменит Veo в приложении Gemini.
Главная особенность: редактирование через разговор
Это ключевое отличие от всего, что было раньше. Вместо классических таймлайнов и слоёв пользователь просто говорит или пишет, что изменить: «убери человека на заднем плане», «сделай освещение теплее», «замени голос диктора на женский». Модель применяет изменения и перерендеривает видео.
То есть процесс редактирования видео перестаёт требовать специальных навыков. Вы просто объясняете, что хотите, как объяснили бы это монтажёру.
Что умеет Omni
Gemini Omni Flash генерирует 10-секундные видеоклипы с синхронизированным аудио из единого мультимодального промта.
Внутри модель объединяет несколько технологий Google: Veo для генерации видео, Nano Banana для редактирования изображений и Genie для более широких генеративных задач.
Одна важная вещь, которую Google намеренно не включила на старте: редактирование речи и аудио внутри уже готовых видео — эта возможность придержана. Почему — Google не объясняет, но очевидно, что редактирование голоса реального человека в видео — слишком чувствительная территория.
Маркировка и защита от дипфейков
Все видео, созданные с помощью Omni, содержат SynthID — фирменный цифровой водяной знак Google, встроенный в файл невидимым образом. Его можно проверить прямо в приложении Gemini. По данным Google, к моменту запуска Omni технология SynthID уже была использована для маркировки более 100 миллиардов ИИ-сгенерированных изображений.
Где доступно и сколько стоит
С 19 мая Gemini Omni Flash доступен в приложении Gemini и Google Flow для подписчиков AI Plus, Pro и Ultra, а также бесплатно в YouTube Shorts и приложении YouTube Create. Платный доступ начинается с тарифа AI Plus за $7,99 в месяц. API для разработчиков и корпоративных клиентов появится в ближайшие недели, цены пока не объявлены.
Более тяжёлая версия — Omni Pro — уже анонсирована, но дата выхода не названа.
В итоге
Gemini Omni — это попытка Google сделать создание и редактирование видео таким же простым, как переписка. Закидываете фото, текст, фрагмент другого видео — получаете готовый клип. Не нравится что-то — говорите, что изменить, и модель переделывает. Это не очередной генератор «текст в видео», а инструмент, где вся цепочка от идеи до финального результата происходит в одном окне, через обычный разговор.