Gemini Omni: что умеет, где пользоваться, первые тесты

Но генерациями с нуля довольны не все.

Источник: @fofrAI

Компания представила Gemini Omni Flash на презентации Google I/O 2026. Как и китайская Seedance 2.0, модель научилась обрабатывать референсы всех форматов: исходные видео, фотографии, рисунки, аудиозаписи голоса, музыку и фоновые шумы.

Автор прислал Seedance 2.0 и Gemini Omni фотографию и аудиозапись. Попросил, чтобы окна в доме зажигались под музыку. Источник: @0xkydo

Gemini Omni Flash доступна в чат-боте Gemini и ИИ-сервисе Flow (не открывается с российских IP-адресов). Понадобится подписка: Plus за $8 в месяц, Pro за $20 в месяц или Ultra с тарифами за $100 и $200 в месяц.
Водяной знак сохраняется во всех планах, убрать его нельзя.
Бесплатно можно протестировать модель в YouTube Shorts и YouTube Create для редактирования своих загруженных коротких роликов.

Как пишут пользователи, Omni не меняет загруженное аудио и речь персонажей, синхронизируя движения губ. В отличие от Seedance, которая искажает аудиодорожки и «придумывает» свой текст. Все модели Google поддерживают русский язык.

Пользователь загрузил аудиозаписи речи и попросил сгенерировать видео. Источник: @Mho_23

Лучше всего, по словам тестироващиков, Gemini Omni справляется с редактированием реальных видео: добавляет спецэффекты, новых персонажей и предметы, меняет погоду и антураж.

Многие ошибочно сравнивают Gemini Omni с Seedance 2.0, но концептуально это совершенно разные продукты. Это первая подобная модель для редактирования видео, которая работает, как Nano Banana.
Карлос Сантана, ИИ-энтузиаст

Источник: @DotCSV

Источник: @pfanis

Источник: @katedeyneka

Креатор показал в X фрагмент подкаста Google Release Notes, куда с помощью Omni добавил обезьяну, кота и попугаев. Источник: @fofrAI

По отзывам, модель лучше генерирует видео с людьми по текстовому описанию, если загрузить свою фотографию в разделе «Аватар». Например, ИИ-креатор под ником Chris First «перенёс» себя на конференцию Google.

Источник: @chrisfirst

В роликах Gemini Omni использует знания языковых моделей Google о мире. Можно загрузить фотографию места и попросить сгенерировать экскурсию или создать «документальный фильм» с инфографикой.

Источник: @shiri_shh

Пользовательница попросила сгенерировать экскурсию по чайна-тауну. Источник: @venturetwins

Модель хорошо показывает себя в последовательном редактировании генераций. Например, меняет только антураж и внешность, но сохраняет действие и раскадровку.

Источник: @jerrod_lew

Генерации сцен на общем плане и сложных движений улучшились, но не так сильно, по сравнению с Seedance 2.0. Максимальная длина видео у Omni — 10 секунд, у Seedance — 15.

Источник: @cipherwebthree

Источник: nachos2d

#редакция #google #omni

Nano Banana для видео: в соцсетях тестируют Gemini Omni и называют лучшей в редактировании роликов

Доступ к Gemini Omni Flash

Отзывы: с чем Omni справляется лучше конкурентов

Сравнение с Seedance 2.0

Gemini Omni Flash

Seedance 2.0

Gemini Omni Flash

Seedance 2.0