130 лет мы писали сценарии, снимали людей и монтировали, пока не пришла нейросеть
Эту историю для моего блога рассказал нейрорежиссер Егор Апполонов.
Двадцать лет я занимался журналистикой. Работал в крупных изданиях, снимал документальные фильмы и репортажи. Устал от классической журналистики и ушел в маркетинг. Нейросети интересовали меня с самого начала их активного развития. Сначала генерировал статичные изображения, затем анимированные, теперь создаю полноценные видео.
Журнал «Синтетика»: первый масштабный проект
Первым крупным проектом стал онлайн-журнал «Синтетика». Его концепция: медиа, где статьи пишет ИИ, а изображения генерируют нейросети.
Название объединяет два смысла: синтетический контент (искусственный) и синтетическая этика (размышления об этичности использования нейросетей для создания дипфейков).
Процесс создания начинался с идеи. Записывал задумки в специальный файл, затем реализовывал их. Технологии того времени не позволяли воплотить все замыслы, многие идеи пришлось отложить.
Технологии для «Синтетики»
Для создания изображений использовал преимущественно Midjourney. Генерация визуального контента занимала большую часть времени. Тщательно работал над каждым изображением, чтобы избежать типичных нейросетевых артефактов: лишних конечностей или искаженных лиц.
Основной критерий качества: изображение должно выглядеть реалистично. Читатель должен не сразу понять, что статья создана искусственным интеллектом.
Текст генерировал с помощью ChatGPT. Нейросеть быстро усвоила нужный стиль и тон повествования.
Сами материалы
В журнале публиковались разнообразные вымышленные новости и истории:
– Находка археологов в Гизе: технологии будущего в Древнем Египте (туалеты со смывом, велосипеды, пицца)
– Скандальная коллекция фотографа, личность которого не установлена
– Новая линейка кроссовок Nike в честь Хогвартса
– Каталог ИКЕА с «грязными комнатами» — реалистичные интерьеры вместо идеальных картинок
Победа на фестивале ИИ-фильмов
После экспериментов с «Синтетикой» логичным шагом стало участие в фестивалях ИИ-фильмов.
Первый конкурс — фестиваль от Runway. Не выиграл, но получил ценный опыт. Изучив работы победителей, понял, что фестиваль ориентирован на арт-хаус, а не на мой подход к созданию контента.
Второй фестиваль — My Film 48. Задача: создать фильм за 48 часов по одному из творческих заданий. Выбрал тему про инопланетян и роботов из пяти предложенных вариантов.
Процесс создания фильма
Разработку сюжета начал с выбора формата. Вдохновился фильмом «Район №9» и решил сделать псевдодокументалистику: новостные репортажи, съемки с места событий, интервью очевидцев.
Основа сюжета: инопланетные корабли атакуют Землю, элитное подразделение роботизированного спецназа вступает в бой с пришельцами.
Первый этап — набросок структуры фильма. Выписал ключевые сцены, драматургические повороты, составил поэпизодник.
Для разработки диалогов и репортажных текстов использовал Gemini от Google. ChatGPT не подошел из-за недостаточной глубины, а Claude оказался слишком «зацензуренным» для историй с насилием.
Параллельно изучал визуальные референсы. Анализировал операторские приемы и монтажные решения из «Района №9», открытого на втором экране.
Визуальные решения фильма
Фильм построен по принципу документальной съемки. Основной визуальный прием — hand-held camera (съемка с рук). Камера трясется, не всегда точно фокусируется, создавая эффект репортажа с места событий.
Первый кадр фильма показывает человека с плакатом, протестующего против пришельцев. Этот репортаж прямо с улицы, мы прямо на пикете.
Резкий зум-ин со съемкой с вертолета создает ощущение погружения в эпицентр событий. Тряска камеры имитирует съемку военным, находящимся в вертолете. Статичный кадр выглядел бы ненатурально, а тряска добавляет документальной достоверности.
Монтажные переходы между видом корабля со стороны и из кабины вертолета дают зрителю разные ракурсы восприятия. Я стремился показать не просто набор движущихся картинок, а дать возможность увидеть события глазами участников. Логичная монтажная драматургия требует показать космический корабль из разных точек.
Кадры с новостной ведущей выполняют информационную функцию. Они дают зрителю необходимый контекст, рассказывая о вторжении и текущей ситуации. Вставки вызывают доверие зрителя из-за привычного формата новостей.
Роботы элитного подразделения показаны без лишних художественных приемов. Сам робот выступает главным элементом драматургии этих кадров. Следующий план показывает человека в кабине робота, раскрывая важный сюжетный момент: этими машинами управляют люди.
Я сделал детали, чтобы было за что зацепиться при повторном просмотре. Вот, например, нашивка на рукав, так зритель понимает, что есть какие-то элитные подразделения по борьбе с инопланетянами
Кадр с кораблем — это прямая отсылка к «Району №9». Я специально взял похожий космический корабль и добавил эффект VHS-съемки.
Финальные кадры с истребителями F-16 дают зрителю возможность пережить эмоцию, недоступную в реальной жизни – увидеть космический корабль глазами пилота истребителя.
Инопланетянин в костюме Adidas и пришелец с гамбургером в финале фильма выполняют двойную функцию: с одной стороны, это была часть конкурсного задания, с другой – эти образы создают культурный контраст, представляя захватчиков через земные, узнаваемые атрибуты.
Завершающий кадр с горящим космическим кораблем оставляет открытый финал. Зритель видит намек на возможную победу людей, но полной уверенности нет. Зритель может додумать историю сам.
Я сделал резкий монтаж и быстрые смены планов, это удержит напряжение зрителя на протяжении 90 секунд фильма.
Технический стек
Для плаката с текстом и парня в шапочке из фольги использовал Flux с реалистичной лорой. Получился трушный, замыленный вид, как на любительской съемке.
Озвучку делал через Eleven Labs. Сделал уникальные голосовые профили для каждого персонажа:
Новостной ведущий с официальными интонациями
Разные персонажи с характерными особенностями речи
Парень в шапке из фольги с «даунской» интонацией
Для синхронизации голоса с движением губ использовал сервисы липсинка: Hedra и Kling. Процесс: совмещаешь видео с открывающимся ртом и аудиофайл, ИИ автоматически синхронизирует.
Звуковые эффекты окружения (вертолеты, взрывы, крики толпы) генерировал в Eleven Labs. Саунд-дизайн — одна из самых сложных частей монтажа.
Для визуальных эффектов разрушений использовал комбинацию Minimax, Kling и Midjourney. Качественный продукт невозможно создать одной нейросетью — нужен «оркестр» инструментов.
Весь процесс занял около 30 часов непрерывной работы. На генерацию визуального контента ушло примерно 30% времени, остальные 70% заняли монтаж и саунд-дизайн.
Полный технологический стек:
Midjourney, Minimax, Flux — генерация визуального контента
Gemini от Google — сценарий
Eleven Labs — голоса и звуковые эффекты
Hedra и Kling — липсинк
Final Cut Pro — монтаж
Runway Gen3 — один кадр с космическим кораблем над Землей
Фильм занял первое место на фестивале.
Реклама, о которой меня не просили
Я стараюсь участвовать максимально в конкурсах — потому что это вызов, и новый опыт, и возможность себя оценить. Например, когда МТС делали конкурс на рекламный видео-ролик — я участвовал. Главный приз был планшет, планшет мне не нужен, я просто принимал вызов.
Когда я увидел рекламу Porsche от Ласло Газали, сделанную полностью с помощью ИИ, я понял — что это вызов. У меня как раз под рукой был новенький Veo 2 от Google — генератора видео с невероятной реалистичностью, мне хотелось проверить его в бою.
Я сделал оммаж рекламе Porsche, перенеся действие из солнечной Италии в российскую глубинку. Вместо итальянской семьи Пьетро — семья Ивановых, вместо Porsche — классические «Жигули».
Сюжет и реализация
Структура оригинальной рекламы: рассказчик говорит о необычной особенности главного героя, его отца и деда (гибкая шея), причина раскрывается в финале. В моей версии у Петра, его отца и деда были сильные руки.
Мне нужно было показать, что Ивановы это семья, я придумал простой способ — рыжие волосы. Рыжий полный мужик в советской пилотке с рыжими усами и его тощий, но сильный рыжий сын.
Технологии и процесс создания
Для этого проекта использовал минимальный технологический стек: только Veo 2 от Google для генерации видео и Final Cut Pro для монтажа.
Единственный не-ИИ элемент — русская озвучка. Пришлось привлечь живого диктора, так как нейросети плохо справляются с русским языком. Для английской версии клонировал голос из оригинальной рекламы Porsche через Eleven Labs.
Работа с Veo 2 требует глубоких знаний кинопроизводства. Для каждого кадра необходимо детально описать:
Крупность плана
Глубину резкости
Освещение
Оптику
Движение камеры
Пример промпта: «средний крупный план с глубиной резкости диафрагмы 2.8, движение камеры — долли аут». Долли аут — это когда камера чуть-чуть отъезжает, для создания динамики кадра
Сложности и решения
Главная сложность — сохранение постоянства персонажа в разных сценах. В Veo 2 нет функции лор (в отличие от генераторов изображений). Приходилось каждый раз детально описывать персонажа текстовыми промптами.
Отдельные детали требовали особого внимания. Например, кадр с газетой «Правда» пришлось генерировать более 15 раз, чтобы добиться читаемого русского текста.
Время и стоимость
Проект занял около пяти дней при работе по 3-5 часов в день параллельно с другими проектами. При полной концентрации только на этом проекте хватило бы двух дней.
Финансовые затраты:
Veo 2 — около 55 центов за генерацию
Около 300 дублей для проекта
Общая стоимость инструментов и выводы
Ежемесячные затраты на технологический стек — 450-500 долларов:
Kling — 90 долларов
Eleven Labs — 20 долларов
Minimax — 90 долларов
Sora
Adobe
Final Cut Pro
Midjourney
Работа с нейросетями требует постоянного обучения. Технологии развиваются ежедневно, невозможно остановиться на достигнутом.
Главная проблема многих нейросетевых видео — отсутствие киношного бэкграунда у создателей. Качественное видео — это не просто движущиеся картинки, а история с драматургией, персонажами, продуманным звуком и монтажом.
Ключевой принцип успешной работы: никогда ничего не получается с первого раза. Генерация контента — это многократные попытки с постоянной корректировкой промптов для достижения идеального результата.
Полные видео-ролики можно посмотреть в моем блоге Сегодня без ИИ, а завтра без работы. В блоге вышли уже три подробных интервью, таких как это.
Приступая к тестированию новейших ИИ-генераторов видео, я хотел ответить на простой вопрос: насколько хорошо они могут оживить статичное изображение?
Всё началось с запроса от группы психологов, которые проводят тренинги по профессиональному выгоранию. Они хотели необычную визуализацию для своих корпоративных программ — что-то, что иронично показало бы офисную жизнь и проблемы выгорания.
Представьте, что вы сидите на золотой жиле, но копаете медленной ложкой вместо мощного экскаватора. Именно так обстоят дела у большинства B2B-компаний, которые лишь надеются на рекламу в Яндекс.Директе и не ищут другие каналы.
Как создать рекламный AI-ролик? Какие методы лучше использовать? Какие сложности возникают? В статье описываю основные нюансы, связанные с производством коммерческого видео с помощью нейросетей.
ИИ-реклама больше не эксперимент — она уже заменяет классический продакшен
Злоумышленники представляются рекрутерами крупных компаний, просят соискателей войти в «корпоративный Apple ID», а затем блокируют их мобильные устройства.
Здравствуйте, дорогие читатели! Меня зовут Макс Олимпов! Сегодня я расскажу о новом революционном продукте в мире искусственного интеллекта — нейросети Hailuo MiniMax S2V-01. Это не просто очередной инструмент для обработки данных или создания контента, а настоящий прорыв, который может изменить то, как мы воспринимаем видеоконтент. Если вы думаете…
Из чего состоить процесс автоматизации создания рилсов?
Для рекламы ИИ-инструменты сегодня — то же самое, что появление интернета для телекоммуникаций или индустриальная революция для промышленности. Нужен ли ИИ в рекламе? В этом сомнений нет. Как избежать ошибок при работе с новым инструментом? Это вопрос.
На мой взгляд многие создателии ИИ контента страдают от отсутствия таланта как такового. Чтобы создать полноценный фильм, нужно иметь неплохой сценарий, с продуманными персонажами, диалогами и прочим,
Стоит хотя бы знать, что такое правило третей, восьмерка, и крупности.
многие создателии ИИ контента страдают от отсутствия таланта как таковогоКомментаторы в интернете тоже этим страдают, но мы же их за это не порицаем.
Классно, для меня мир кино, что-то заоблачное, а тут ещё и с ии
Я вот начинаю уже думать, что пора открывать Голивуд у себя на балконе
Будущее наступило
Но за мной так и не приезжает гребанное летающее такси