Google представила улучшенный генератор видео Veo 2 и открыла запись в лист ожидания для тестирования

В сети опробовали реалистичность модели и сравнили с Sora от OpenAI.

Генерация Veo 2. Источник: Jerrod Lew

Google представила модель Veo 2 для создания видео с разрешением до 4K и длиной несколько минут. Она «лучше понимает физику реального мира и нюансы человеческих движений и мимики», утверждают в компании.
Теперь модель распознаёт термины из кино и фотографии. В запросе можно указать кинематографический жанр, прописать метод съёмки, например «объектив 18 мм», чтобы получить широкоугольный кадр, или написать «малая глубина резкости» — тогда модель сфокусируется на объекте и сделает более размытый фон.
В сети Veo 2 сравнивают с Sora от OpenAI.

Генерация Veo 2 по запросу: «Пара рук, умело нарезающих спелый помидор на деревянной разделочной доске». Источник: Joseph Carlson

Генерация Sora по тому же запросу. Источник: Joseph Carlson

Пользователи отмечают, что Veo точно следует даже детализированным запросам, в отличие от Sora.

Генерация Veo 2 по запросу: «Общий план, камера приближает рыцаря в золотом шлеме, он начинает скакать на зебре, опускает копьё и направляется к осьминогу с часовым механизмом». Источник: Ethan Mollick

Генерация Veo 2 по запросу: «Пожилой мужчина читает газету в поезде. На последнем листе новость, что цены на картофель растут». Источник: MBZ

Записаться в лист ожидания и попробовать модель можно в VideoFX в Google Labs — недоступно с российских IP-адресов. В 2025 году Veo 2 планируют интегрировать в YouTube Shorts и другие продукты Google.
3 декабря 2024 года Google дала ограниченный доступ к Veo разработчикам и компаниям. Например, марка печенья Oreo будет использовать нейросеть для создания рекламных роликов.
Google также улучшила модель для создания изображений Imagen 3, теперь можно генерировать больше стилей — от фотореализма до аниме. Она доступна в ImageFX от Google Labs с американских IP-адресов.

Компания начала тестировать сервис Whisk для генерации изображений по трём референсам: объекта, сцены и стиля. Пока его могут опробовать пользователи в США.
Генераторы фотографий и видео впервые представили на презентации в мае 2024 года.

#новости #google #ии