VEO 3 | Как пользоваться этой нейросетью для создания видео?
В этой статье про Google Veo 3 речь будет идти про ее более старшую версию - Veo 3.1
Только ленивый не видел все эти видео с репортажами, бабулями с бегемотами и медведями на мотоциклах. Корень всего этого зла - нейросеть Veo 3, ставшая первой нейросетью, которая может озвучивать видео на русском языке.
Однако, с момента обретения максимального хайпа, нейросеть VEO 3 стала сильнее и в ней появились интересные режимы, которые мы рассмотрим в данной статье. И теперь ее можно назвать по-настоящему профессиональным инструментом в умелых руках.
Содержание:
Данная статья создана с целью инструктажа наших пользователей, как работать с этой нейросетью для создания видео.
Обзор функций нейросети VEO 3
Нейросеть VEO 3 (а, точнее, VEO 3.1) предоставляет пользователям несколько вариантов генераций. Давайте сначала чуть-чуть поговорим о каждой, а затем - создадим видео в каждом из вариантов, чтобы понимать наглядно.
Создание видео из текста через VEO 3 Тут все очевидно: VEO 3 может создавать видео по текстовому промпту. Ничего нового и удивительного, но сразу отмечу, что VEO 3 создает видео со звуком и речью и может создавать видео с русской речью, также, как и Sora 2.
Создание видео из картинки в нейросети VEO 3
Также, VEO 3 может создавать видео из стартового кадра. Более того, прикрепив стартовый кадр у вас открывается возможность добавить еще и конечный кадр: очень удобно, чтобы сделать видео с "превращениями" или зацикленные видео (когда конечный кадр такой же, как начальный)
Продление видео через VEO
По умолчанию VEO 3 создает только видеоролики длительностью 8 секунд. Однако с выходом версии VEO 3.1 появилась возможность продлевать видео с сохранением непрерывности звука и картинки. Очень удобная функция и аналогов ей, на данный момент, нет. Аналоги есть только с продлением картинки, но не звука.
Генерация с референсными объектами
На мой взгляд, это самый интересный режим создания видео в VEO 3. Суть метода в том, что вы можете загрузить несколько изображений каких-либо объектов.
Допустим: конкретный электрочайник, определенный стол и конкретная кружка.
И написать текстовый промпт, чтобы человек подошел, взял чайник в руку и налил воды в кружку. В сгенерированном видео будут как раз те чайник, кружка и стол, которые вы указали. Идеально для продавцов на маркетплейсах, к примеру.
Стоит отметить, что этот режим доступен только для VEO 3.1 Fast в формате 16:9.
Теперь давайте по порядку о каждом из методов.
Создание видео из текста через VEO 3
Создавать видео мы будем через нашего Нейрон Бота, куда уже внедрено более 16 нейросетей. На момент написания статьи у нас есть подписка Промо-Максимум, которая позволяет получить тестовый доступ на 2 дня за 59 рублей. Этого вам хватит, чтобы создать парочку видео через VEO 3.
Давайте создадим видео из текста с промптом, который мы использовали в нашем обзоре на Kling. Только, переделаем его немного, чтобы девушка в видео сказала что-нибудь на русском:
A cinematic, emotionally charged scene of a beautiful woman waiting at a vintage train station platform. Medium-close shot transitioning to close-up. The woman is in her late 20s, wearing an elegant 1940s-style coat in deep burgundy, her dark hair styled in soft waves. She stands alone under warm, golden hour lighting filtering through large station windows, creating dramatic shadows and highlights across her face. Her expression shows deep longing and quiet desperation - eyes glistening with unshed tears, one single tear slowly rolling down her left cheek. She occasionally glances at an old pocket watch in her trembling hands, then looks toward the empty railway tracks with hope fading to resignation. On this moment she says Ну где же он? Неужели опаздывает? Her lips are slightly parted as if holding back a sob. Camera movement: slow, subtle dolly-in combined with a slight tilt, emphasizing her emotional isolation. The background shows blurred steam from distant trains, vintage luggage scattered on benches, and soft bokeh lights. Color grading: warm sepia tones with deep shadows and golden highlights. Film grain texture for authentic cinematic feel. Lighting: dramatic chiaroscuro with key light from station windows, rim lighting outlining her silhouette. Atmosphere: melancholic, romantic, nostalgic. Style: reminiscent of classic Hollywood drama films, Wong Kar-wai aesthetic. 4K resolution, 24fps, shallow depth of field.
Создадим мы это видео через две версии: VEO 3.1 Fast и VEO 3.1 Quality. Заодно и проверим, стоит ли переплачивать за версию VEO 3.1 Quality.
Вот, как сделать видео через VEO 3.1:
Сравнение VEO 3.1 Fast и VEO 3.1 Quality
Промпт выше в VEO 3.1 Fast дал следующий результат:
Есть до чего докопаться. Например, слезы неестественные. Да и пар из рельсов выходить не должен. Но в целом - хорошо, нейросеть VEO достаточно стабильна и хорошо понимает промпты.
Теперь давайте посмотрим, что сделала версия VEO 3.1 Quality:
Новым читателям я напомню, что видео я не подгоняю под хороший результат, а выкладываю так, как у меня получилось с первого раза.
Несмотря на то, что создать видео через VEO 3.1 Quality оказалось в 4 раза дороже - результат стал еще хуже:)
Липсинка нет, слезы все такие-же неестественные.
Если бы мне нужно было это видео куда-то в продакшн - я бы изменил промпт, чтобы она была без слез. В данном случае VEO не может нормально их отрисовать.
Нет слез - нет проблем:)
Но тени и свет, на мой взгляд, у версии 3.1 получились лучше. Но что лучше и что хуже - подыдожьте сами..
А мы идем далее.
Создание видео из картинки в нейросети VEO 3
Это уже поинтереснее. Вы можете оживить фото, сделать его говорящим или покреативить как-то по-своему.
VEO 3 позволяет установить начальный кадр для вашего видео. А если вы загрузили начальный - позволяет использовать еще и конечный кадр.
Давайте, для примера, создадим в нейросети VEO 3 видео, на котором одна модель. Porsche 911 превращается в другую, как трансформер.
Вот я скачал две фотографии данных моделей и теперь приведу их к нормальному виду через Nano Banana. Как пользоваться данной нейросетью я писал в этой статье.
Красная машина - начальный кадр. Серая - конечный. Данные фото я пропустил через Nano Banana, указав промпт и вот что у меня получилось:
Теперь, используя эти начальные и конечные кадры, давайте соберем наше видео, используя Нейрон Бот:
Промпт сразу на английском языке. Кому надо - переводчик в помощь:
The car turns from the starting frame, like a transformer, into a car on the final frame. The transformation must be intense. Video without words. All other details are unchanged.
Инструкция, куда нажимать:
Вот, что мы получили в итоге:
Довольно таки неплохо, но я хотел бы чтобы превращение было какое-то более интенсивное. Но для демонстрации - самое то.
P.S: видео пришлось чуть подрезать, так как в конце VEO выкинул кое-что интересное. То-ли осколки, то-ли мусор какой-то не в тему:
Видимо, VEO 3 так видит превращение мягкой крыши в жесткую.
Это вам тоооооооооненький намек на то, что надо сразу писать нормальные промпты - тогда будет нормальный результат.
Теперь давайте все тоже самое, но с нормальным промптом:
Create a dynamic and visually engaging video where the car featured in photo 1 undergoes a seamless transformation into the car shown in photo 2, similar to a robot transformer. The transformation should be smooth and fluid, showcasing mechanical and robotic elements as the car morphs from its initial form to the final form. Ensure that all other elements in the environment, such as the background, lighting, and any objects or scenery, remain consistent and unchanged throughout the transformation process. The video should capture the essence of a futuristic transformation, highlighting the intricate details and movements of the car as it evolves from one state to another.
И вот какой шедевр мы получили:
Давайте теперь продлим это видео.
Продление видео через VEO
Нейросеть VEO 3 позволяет продлевать видео еще на 7 секунд. А потом еще на 7. Ну и так далее до минуты:) Причем, видео продлевается с сохранением голосов и звукового окружения, что не маловажно.
Давайте наше видео с превращением Porsche 911 продлим, как будто бы он уезжает с пробуксовкой.
Нажимаем на "Продлить видео"
Используем следующий промпт:
The car standing in the starting frame first blinks its headlights twice, then starts with a slip, makes a U-turn and drives away, with exhaust crackles and pops
Обратите внимание, что VEO 3 выдает новое видео, которое надо склеить с предыдущим самостоятельно. Место склейки - 7 секунд от первого видео.
Вот пример видеоряда, как склеить два видео:
Вот, какое полное видео мы получили:
Да, да, да, сзади не порш я знаю! Видео в демонстративных целях, над реалистичностью тут надо работать.
Здесь я просто показал как продлить и склеить видео:) Таким образом, далее вы тоже можете продолжать ваши видео.
Так VEO 3 позволяет сделать видеоролик длиной до минуты, с сохранением непрерывности картинки и звукового окружения.
Самый интересный режим создания видео в VEO 3
И завершает наш обзор на нейросеть VEO 3 - референсный режим.
Давайте разберем его сразу на практике. Давайте создадим видео, в котором будут присутствовать кружка, топор и ваза:
Напишем следующий промпт в Нейрон Бот:
A magician with his hat off stands in front of a black wall near a wooden table exactly in the middle. In his right hand he holds an axe, as in photo 1. There is a mug on the table on the left, as in photo 2. There is an inverted hat in the middle of the table. At the beginning of the video, the magician takes a vase out of his hat, as in photo 3, and places it on the table on the right. Then he smashes it with an axe, which he has in his right hand.
Вот инструкция, как сделать видео:
А вот какое видео у нас получилось:
Фантазия, конечно, у VEO 3 необычная:)))) боюсь продлевать видео
Но, в целом, как видите - все объекты на видео сохранены в точности, как на фото.
На мой взгляд, это идеальная фича для тех, кто занимается маркетплейсами и вообще как-то связан с видео визуалом товаров.
На этом наш обзор VEO 3 подошел в концу. Надеюсь, было полезно. Ну и по традиции - захейтить в комментариях можно в нашем канале Нейрон, где мы делимся полезными приемами работы с нейросетями и рассказываем другую полезную информацию из мира нейросетей.
А за нейросетями - сюда: