Nano Banana для видео: в соцсетях тестируют Gemini Omni и называют лучшей в редактировании роликов
Но генерациями с нуля довольны не все.
Источник: @fofrAI
- Компания представила Gemini Omni Flash на презентации Google I/O 2026. Как и китайская Seedance 2.0, модель научилась обрабатывать референсы всех форматов: исходные видео, фотографии, рисунки, аудиозаписи голоса, музыку и фоновые шумы.
Автор прислал Seedance 2.0 и Gemini Omni фотографию и аудиозапись. Попросил, чтобы окна в доме зажигались под музыку. Источник: @0xkydo
Доступ к Gemini Omni Flash
- Gemini Omni Flash доступна в чат-боте Gemini и ИИ-сервисе Flow (не открывается с российских IP-адресов). Понадобится подписка: Plus за $8 в месяц, Pro за $20 в месяц или Ultra с тарифами за $100 и $200 в месяц.
- Водяной знак сохраняется во всех планах, убрать его нельзя.
- Бесплатно можно протестировать модель в YouTube Shorts и YouTube Create для редактирования своих загруженных коротких роликов.
Отзывы: с чем Omni справляется лучше конкурентов
- Как пишут пользователи, Omni не меняет загруженное аудио и речь персонажей, синхронизируя движения губ. В отличие от Seedance, которая искажает аудиодорожки и «придумывает» свой текст. Все модели Google поддерживают русский язык.
Пользователь загрузил аудиозаписи речи и попросил сгенерировать видео. Источник: @Mho_23
- Лучше всего, по словам тестироващиков, Gemini Omni справляется с редактированием реальных видео: добавляет спецэффекты, новых персонажей и предметы, меняет погоду и антураж.
Многие ошибочно сравнивают Gemini Omni с Seedance 2.0, но концептуально это совершенно разные продукты. Это первая подобная модель для редактирования видео, которая работает, как Nano Banana.
Источник: @DotCSV
Источник: @DotCSV
Источник: @pfanis
Источник: @katedeyneka
Креатор показал в X фрагмент подкаста Google Release Notes, куда с помощью Omni добавил обезьяну, кота и попугаев. Источник: @fofrAI
- По отзывам, модель лучше генерирует видео с людьми по текстовому описанию, если загрузить свою фотографию в разделе «Аватар». Например, ИИ-креатор под ником Chris First «перенёс» себя на конференцию Google.
Источник: @chrisfirst
- В роликах Gemini Omni использует знания языковых моделей Google о мире. Можно загрузить фотографию места и попросить сгенерировать экскурсию или создать «документальный фильм» с инфографикой.
Источник: @shiri_shh
Пользовательница попросила сгенерировать экскурсию по чайна-тауну. Источник: @venturetwins
- Модель хорошо показывает себя в последовательном редактировании генераций. Например, меняет только антураж и внешность, но сохраняет действие и раскадровку.
Источник: @jerrod_lew
Сравнение с Seedance 2.0
- Генерации сцен на общем плане и сложных движений улучшились, но не так сильно, по сравнению с Seedance 2.0. Максимальная длина видео у Omni — 10 секунд, у Seedance — 15.
Gemini Omni Flash
Источник: @cipherwebthree
Seedance 2.0
Источник: @cipherwebthree
Gemini Omni Flash
Источник: nachos2d
Seedance 2.0
Источник: nachos2d
50 комментариев