Как создавать многосюжетные видео с помощью Veo 3.1
Подробное руководство по созданию ИИ-видео, которые станут вирусными.
В последнее время многие авторы обращаются к искусственному интеллекту для создания образовательного или обучающего контента. Наверняка вы хотя бы раз встречали на TikTok одно из сгенерированных ИИ объяснительных видео, показывающих, как египтяне сделали пирамиду, верно?
Эти видео часто создаются с помощью таких видеомоделей, как Veo или Sora, где вы просто описываете сцену, а через несколько секунд получаете восьмисекундный ролик на основе введенного вами текста.
Однако придумать хороший промпт очень непросто. Конечно, вы можете написать конкретные инструкции по элементам, углу камеры и таймингу, но на самом деле результат часто не совпадает с тем, что вы себе представляли.
Помимо несоответствия качества, создание ИИ-видео - удовольствие не из дешевых. Вы можете легко сжечь 10 долларов за пять неудачных попыток и расстроиться, если не получите желаемого результата.
Последний релиз модели Veo 3.1 помогает решить эти проблемы.
Теперь вы можете задать первый и последний кадр конечного видео, а искусственный интеллект заполнит кадры между ними, следуя описанию, которое вы задали в промпте.
Таким образом, вы получаете контроль над тем, как выглядит первая и последняя сцена, устанавливаете правильные углы камеры и даете указания ИИ о том, как должно выглядеть и восприниматься конечное видео.
В этом руководстве я расскажу вам о полном процессе создания иммерсивного ИИ-видео с точным контролем камеры и непрерывностью сцен с помощью Veo 3.1 в боте SYNTX.
Давайте начнем.
Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети, канал с гайдами и советами по работе с нейросетями и про генерацию изображений - я стараюсь делиться только полезной информацией.
Инструменты, которые вам понадобятся
Вот какие инструменты и ИИ-модели понадобятся вам для создания финального видео. Каждый из них играет важную роль в рабочем процессе.
- Генератор изображений. Вы можете использовать любую модель для генерации изображений, которая вам больше нравится. Я рекомендую использовать Nano Banana.
- Генератор видео. Вы также можете выбрать любую модель для создания видео, но я рекомендую использовать Veo 3.1 для лучшего качества и согласованности.
- Генератор аудио. Вам понадобится генератор голоса, например ElevenLabs AI, чтобы создать дикторский текст для видео.
ИИ-чатбот. Мы будем использовать ChatGPT для мозгового штурма идей для сюжета, а также для создания сценария, промптов и т. д. - Редактор видео. Чтобы объединить несколько видео, вы можете использовать любой редактор, например CapCut, Premiere Pro или FinalCut Pro.
Создание изображений и видео доступно на платформе invideo. Вам не обязательно использовать для этого отдельные инструменты.
Генерация идей для контента
Первое, что вам нужно сделать, - это придумать интересную идею для вашего видео. Если ваша концепция недостаточно интересна, ее не спасет даже самая лучшая ИИ-модель. Вирусный контент всегда начинается с захватывающего цепляющего момента.
Вы можете попросить ChatGPT помочь вам в мозговом штурме идей для коротких образовательных или мистических видео. Такие темы, как правило, очень хорошо работают в TikTok и Reels, потому что они вызывают любопытство.
Вот пример промпта:
Придумай идеи коротких видеороликов, которые будут загадочными, историческими и интересными. Убедись, что они могут легко стать вирусными на TikTok или Reels.
Если ничего из списка не нажимается, просто регенерируйте промпт. Мне нравится идея о том, как египтяне создавали пирамиды. Давайте использовать эту концепцию в качестве примера на протяжении всей статьи.
Генерация референсных изображений
Посмотрите на пример сгенерированного ИИ изображения Великой пирамиды Гизы с использованием этого текстового промпта и модели Nano Banana:
A great pyramid of piza photo as if it was newly built. The outside is polished, plain stones, proportional, and golden top portion. the background is ancient too, no buildings. aerial shot. slightly zoomed out
Чтобы создать первый и последний кадры сцены, нам нужны как полностью построенная Пирамида, так и место ее строительства. Итак, для первого кадра сцены используйте изображение выше и попросите ИИ удалить саму пирамиду.
Remove the Pyramid and replace with flat and rough base of the structure
Отлично. Теперь, когда у вас есть начальный и конечный кадры сцены, пришло время сгенерировать первое видео.
Генерация видео
Чтобы создать сцену, используя первый и последний кадры, выберите Veo 3.1. Загрузите оба референсных изображения и опишите желаемое конечное видео в поле для ввода промпта.
Пример промпта: Mechanical construction.
Вот как выглядит финальное видео:
Чтобы создать еще одну сцену, показывающую группу египтян, несущих камни из каменоломни от реки к месту расположения пирамиды, мы будем использовать следующие исходные изображения:
В результате этого процесса вот как выглядит финальное видео:
Вы можете экспериментировать с различными промптами, чтобы настроить стиль анимации и элементы, показанные в видео. Если вы планируете позже добавить фоновую музыку или голосовую озвучку, отключите в настройках звука встроенное аудио для каждого клипа.
Добавление переходов между сценами
Чтобы создать плавный переход между сценами, вы можете продолжить использовать функцию Frames в Veo 3.1. Установите первый кадр сцены перехода на последний кадр первого видео, а последний - на первый кадр второго видео.
Посмотрите этот пример перехода, который соединяет два видеоролика о строительстве пирамиды, которые мы уже создали. Вот промпт, который вы можете использовать:
Seamless transition, no break, fast camera movement
Если у вас больше двух видеороликов, вы можете использовать тот же процесс для создания сцены перехода. Когда все клипы готовы, пришло время добавить голосовое сопровождение.
Создание голосового сопровождения
Чтобы добавить закадровый голос, вы можете использовать любой инструмент преобразования текста в аудио, например ElevenLabs. Перейдите на сайт elevenlabs.io и добавьте пример сценария.
The Great Pyramids of Egypt were built over 4,500 years ago as grand tombs for powerful pharaohs. Skilled workers shaped massive limestone blocks and transported them using sleds, ramps, and incredible teamwork. With precise planning and advanced engineering that still amazes us today, they stacked each stone carefully until the pyramid rose toward the sky. These ancient monuments remain a lasting symbol of human ambition, mystery, and ingenuity
Платформа предоставляет 10 000 бесплатных кредитов, поэтому вам не нужно ничего платить, если вы только экспериментируете. Перед созданием аудиозаписи обязательно выберите голос понравившегося актера и настройте скорость, стиль и эмоции. После этого загрузите готовый файл на локальный диск.
Обратите внимание, что с помощью Veo 3.1 вы также можете вставлять аудио при создании видео; просто укажите сценарий в промпте. Единственный недостаток этого метода заключается в том, что голос актера может звучать по-разному в каждом видеофайле.
Собираем все вместе
Чтобы объединить все видео и голос за кадром, вы можете использовать любой видеоредактор на ваш выбор. Некоторые из наиболее рекомендуемых мною редакторов - Adobe Premiere Pro, Final Cut Pro и CapCut.
Просто перетащите все медиафайлы на временную шкалу и выровняйте клипы по дикторскому тексту. Вот результат нашего примера с видеороликом о пирамиде:
Отлично. Вы можете продолжать создавать новые сцены, используя тот же рабочий процесс, чтобы сделать видео более длинным и увлекательным.
Более подробно о том, как создаются такие типы вирусного контента, вы можете узнать из этого поста в Instagram от invideo.
Удивительно видеть, как просто стало создавать высококачественные ИИ-видео, которые могут стать вирусными. Я знаю, что это может вызвать недоумение, потому что процесс не полностью автоматизирован, но эти «ручные» шаги дают вам больше контроля над конечным результатом.
Конечно, вы могли бы автоматизировать все с помощью одного промпта, но, как уже говорилось, всегда есть вероятность, что ИИ создаст нечто отличное от того, что вы задумали. Потратив немного больше времени на планирование первого и последнего кадров, настройку текстовых промптов и регулировку траектории движения камеры, вы сможете значительно улучшить конечный результат.
Что касается качества вывода, то такие модели, как Sora 2 и Veo 3.1, значительно улучшились по сравнению с предыдущими версиями, особенно когда речь идет о движении, согласованности, переходах между сценами и реалистичности. Если объединить их с умными техниками составления промптов и правильным кадрированием, высококачественными исходными изображениями, можно получить результаты, которые гарантированно станут вирусными.
Я надеюсь, что процесс создания роликов в этом руководстве был для вас полезным и увлекательным. Теперь ваша очередь экспериментировать. Попробуйте снять собственное короткое видео, измените промпты и посмотрите, как далеко вы сможете зайти с помощью этих новых инструментов.
Если у вас получится что-то классное, не стесняйтесь поделиться этим.
Источник статьи на английском - здесь