Нейросеть для видео: как создать кинематографичный ролик с сюжетом в Seedance 2.0
В сети завирусился ролик на 75 секунд: охотница в белой маске кицунэ выслеживает в тропическом лесу призрачного богомола, который режет её бумажных оригами-разведчиков невидимыми серпами. Выглядит как трейлер дорогого фэнтези, а собрано целиком в нейросетях. Мы разобрали ролик по кадрам, вытащили из него рабочий процесс и повторили каждый этап в нашем боте. Получилась инструкция, по которой похожее кино соберёт даже новичок.
В статье: полная схема из четырёх фаз, готовые промпты на русском для листа персонажа, монстра и локации, шаблон 12-панельного сториборда, промпт для видео по сториборду и разбор ошибок, которые ловят всех новичков. Все картинки в материале сгенерированы по этим самым промптам - результат видно сразу.
Как устроен такой ролик
Секрет длинных связных ИИ-роликов в том, что никто не генерирует их одним промптом. Фильм собирается как конструктор: сначала фиксируются референсы всех героев и мест, потом каждая сцена прорисовывается сторибордом, и только затем нейросеть для генерации видео оживляет сцены короткими клипами по 10 секунд.
Разобранный ролик состоит из пяти сцен: пролог с легендой о духе-хранителе, разведка оригами, охота монстра, контратака охотницы и финальный ритуал с красной печатью. На каждую сцену - свой сториборд из 12 панелей и свой клип. Дальше клипы склеиваются встык в любом видеоредакторе.
Рабочий процесс: фаза 1 - референс-листы (персонаж, существо, локация), фаза 2 - сториборды по 12 панелей, фаза 3 - видео по промпту с приложенными референсами, фаза 4 - монтаж. Разберём каждую фазу с промптами.
Что понадобится
Все генерации из статьи сделаны в нашем боте Cyber AI. Для листов персонажей и локаций подходит 🍌 Banana 2 PRO, сториборды лучше всего рисует 🎨 Images 2.0 (ChatGPT), а видео оживляет 🎬 Seedance 2. Как повторить: открой бота, выбери раздел 🖼 Создать изображение, зайди в ⚙ Задать параметры, вставь промпт в поле Описание и нажми 🎬 Сгенерировать. Для сторибордов ставь пропорцию 16:9 и качество 2K - мелкие подписи под панелями остаются читаемыми.
Фаза 1. Референс-листы: персонаж, монстр, локация
Референс-лист - это якорь. Без него нейросеть в каждом кадре рисует нового героя: меняются лицо, костюм, пропорции. Лист фиксирует дизайн один раз, а дальше прикладывается к каждой генерации как образец.
Для охотницы генерируем лист с поворотом в полный рост, крупными планами маски и набором поз.
Проверь результат: маска должна оставаться на лице во всех видах и позах. У нас с первого раза нейросеть нарисовала два ракурса с открытым лицом - помогла жёсткая строка про правило маски в начале промпта.
Монстру нужен отдельный лист существа: анатомия, оружие, камуфляж и палитра.
Обрати внимание на этюд камуфляжа: существо, слитое с кучей мёртвых листьев, - ключевой образ всего фильма. Именно по этому референсу видеомодель поймёт, как монстр прячется.
Третий лист - локация. Он держит единый свет и настроение во всех сценах.
Фаза 2. Сториборд: 12 панелей на сцену
Сториборд ИИ рисует одной картинкой: сетка 4 на 3, двенадцать панелей, под каждой - подпись с типом плана. Это раскадровка сцены, по которой потом генерируется видео. Шаблон промпта под любую сцену выглядит так.
Внутрь шаблона подставляешь описание своей сцены и 12 панелей. Вот пример заполнения для пролога - сцены о том, как мирный дух леса превращается в монстра.
Пять сторибордов нашего фильма сгенерированы именно так: пролог, разведка оригами, охота монстра, контратака и ритуал печати. К сценам с охотницей стоит приложить её референс-лист, чтобы маска и костюм не расползлись по панелям.
Фаза 3. Видео по промпту в Seedance 2.0
Каждая сцена оживает отдельным клипом на 10 секунд в формате 16:9. К генерации прикладываются сториборд сцены и все референс-листы, а промпт сжимает 12 панелей в таймлайн с секундами. Русская речь в Seedance пока не работает, но в нашем ролике реплик и нет - только звуковой дизайн, который модель создаёт сама.
Главные правила видеопромпта: расписывай действие по секундам, указывай движение камеры для каждого фрагмента, проси только звуковые эффекты без музыки и обязательно добавляй запрет на стрелки и надписи в кадре. Про последнее - отдельная история в разделе ошибок.
Фаза 4. Монтаж
Клипы склеиваются встык, без переходов: внутри каждого клипа монтаж уже сделан нейросетью по сториборду. Хронометраж нашего образца: пролог 12 секунд, разведка и охота по 12, контратака 24, ритуал 11. Если сцене тесно в десяти секундах - генерируй два клипа на неё и режь по действию. Звук берётся прямо из генераций, музыка сверху не нужна: тишина леса и резкие удары серпов работают лучше любого саундтрека.
Частые ошибки и как их лечить
Стрелки из сториборда протекают в видео. Классические раскадровки рисуют с цветными стрелками направлений. Видеомодель честно переносит их в кадр - в оригинальном ролике на восьмой секунде видны синие стрелки поверх изображения. Лечение: в промпте сториборда запрещай любые стрелки, а движение проси показывать композицией, размытием и линиями удара.
Персонаж плывёт между сценами. Если генерировать сцены без референс-листа, в каждом клипе будет новая героиня. Лечение: лист персонажа прикладывается к каждой генерации, где герой в кадре, а в промпте пишется, что дизайн строго по референсу.
Хук теряется. Сильное короткое действие из начала сцены модель может просто пропустить. Лечение: прописывай его в таймлайне с точным таймкодом и звуковым акцентом.
Иероглифы и случайный текст в кадре. Модели любят дорисовывать надписи. Лечение: строка про запрет текста в каждом промпте, а нужные символы - например иероглиф на маске - описывай отдельно и проверяй результат.
FAQ
Как создавать видео в нейросети, если раньше не пробовал? Начни с одной сцены: сгенерируй лист персонажа, один сториборд и один клип по этой статье. Весь цикл занимает меньше часа.
Какие нейросети для видео использовать в этой схеме? В нашем боте связка такая: Banana 2 PRO для референсов, Images 2.0 для сторибордов, Seedance 2.0 для клипов. Схема переносится и на другие модели.
Можно ли сделать видео из фото, а не из сториборда? Да, режим image-to-video принимает любой кадр как стартовый. Но для связного сюжета сториборд надёжнее: модель видит сразу всю сцену и монтирует её сама.
Сколько стоит собрать такой ролик? Считай по генерациям: три листа-референса, пять сторибордов, пять-семь клипов плюс пересъёмки брака. Дешевле, чем один час аренды съёмочного павильона.
Почему ролик собирают из клипов по 10 секунд, а не одним запросом? Длинное видео по промпту пока держит сюжет хуже: персонажи мутируют, сцены смешиваются. Короткие клипы с общими референсами дают управляемый результат.
Кинематографичное видео в нейросети - это не магия одного промпта, а конвейер: референсы, сториборды, клипы, монтаж. Освоив четыре фазы, ты соберёшь ролик на любой сюжет - от хоррора в джунглях до рекламы своего продукта. Если статья была полезной, поставь лайк - так её увидит больше людей. И расскажи в комментариях, какой фильм хочешь снять первым: интересно, что выберут читатели.