Nano Banana для видео: в соцсетях тестируют Gemini Omni и называют лучшей в редактировании роликов

Но генерациями с нуля довольны не все.

Источник: @fofrAI
  • Компания представила Gemini Omni Flash на презентации Google I/O 2026. Как и китайская Seedance 2.0, модель научилась обрабатывать референсы всех форматов: исходные видео, фотографии, рисунки, аудиозаписи голоса, музыку и фоновые шумы.
Автор прислал Seedance 2.0 и Gemini Omni фотографию и аудиозапись. Попросил, чтобы окна в доме зажигались под музыку. Источник: @0xkydo

Доступ к Gemini Omni Flash

  • Gemini Omni Flash доступна в чат-боте Gemini и ИИ-сервисе Flow (не открывается с российских IP-адресов). Понадобится подписка: Plus за $8 в месяц, Pro за $20 в месяц или Ultra с тарифами за $100 и $200 в месяц.
  • Водяной знак сохраняется во всех планах, убрать его нельзя.
  • Бесплатно можно протестировать модель в YouTube Shorts и YouTube Create для редактирования своих загруженных коротких роликов.

Отзывы: с чем Omni справляется лучше конкурентов

  • Как пишут пользователи, Omni не меняет загруженное аудио и речь персонажей, синхронизируя движения губ. В отличие от Seedance, которая искажает аудиодорожки и «придумывает» свой текст. Все модели Google поддерживают русский язык.
Пользователь загрузил аудиозаписи речи и попросил сгенерировать видео. Источник: @Mho_23
  • Лучше всего, по словам тестироващиков, Gemini Omni справляется с редактированием реальных видео: добавляет спецэффекты, новых персонажей и предметы, меняет погоду и антураж.

Многие ошибочно сравнивают Gemini Omni с Seedance 2.0, но концептуально это совершенно разные продукты. Это первая подобная модель для редактирования видео, которая работает, как Nano Banana.

Карлос Сантана, ИИ-энтузиаст
Источник: @DotCSV
Источник: @DotCSV
Источник: @pfanis
Источник: @katedeyneka
Креатор показал в X фрагмент подкаста Google Release Notes, куда с помощью Omni добавил обезьяну, кота и попугаев. Источник: @fofrAI
  • По отзывам, модель лучше генерирует видео с людьми по текстовому описанию, если загрузить свою фотографию в разделе «Аватар». Например, ИИ-креатор под ником Chris First «перенёс» себя на конференцию Google.
Источник: @chrisfirst
  • В роликах Gemini Omni использует знания языковых моделей Google о мире. Можно загрузить фотографию места и попросить сгенерировать экскурсию или создать «документальный фильм» с инфографикой.
Источник: @shiri_shh
Пользовательница попросила сгенерировать экскурсию по чайна-тауну. Источник: @venturetwins
  • Модель хорошо показывает себя в последовательном редактировании генераций. Например, меняет только антураж и внешность, но сохраняет действие и раскадровку.
Источник: @jerrod_lew

Сравнение с Seedance 2.0

  • Генерации сцен на общем плане и сложных движений улучшились, но не так сильно, по сравнению с Seedance 2.0. Максимальная длина видео у Omni — 10 секунд, у Seedance — 15.

Gemini Omni Flash

Источник: @cipherwebthree

Seedance 2.0

Источник: @cipherwebthree

Gemini Omni Flash

Источник: nachos2d

Seedance 2.0

Источник: nachos2d
21
9
1
50 комментариев