Как самостоятельно сделать ролик-трейлер для книги
Пошаговая инструкция для тех, кто выпускает книгу на краудфандинге
Книги – одна из самых популярных категорий на краудфандинге. Механика простая: автор описывает замысел, рассказывает о сути книги. А те, кому стало интересно, могут сделать предзаказ и таким образом поддержать выход новой книги.
Но как показать аудитории книгу, которой пока еще нет? Пока готовишь к выходу книгу, еще нет читателей с отзывами, да и обложки со страницами пока тоже нет.
На помощь приходят нейросети и искусственный интеллект. Как их использовать правильно, рассказывает Владимир Афанасьев, автор честной книги об ошибках в бизнесе “Факап №18”. Вот его рассказ от первого лица.
Мне нужен был буктрейлер – такой рассказ о книге, чтобы было интересно и захотелось купить, сделать предзаказ.
Сначала я честно пытался найти исполнителя. Исполнители есть, найти их очень просто, но примеры работ в их портфолио напоминают студенческие презентации из 90-х. У них такие визуалы: закат сменяется ночным небом, описание в стиле титров из “Звездных войн”, которые под углом уходят вверх экрана. И в конце колхозный макет самой книги. Короче, не захотел я так.
Спросил ChatGPT: а как сделать самому и лучше? Нейросеть предложила написать сценарий, в котором разбить общий сценарий на сцены до 15 секунд. Это потому что большинство нейросетей пока не умеют пока генерить более длинные видео.
Как сделать сценарий?
Загрузить в нейросеть весь текст книги и дать задачу:
- Ты сценарист, проанализируй книгу и напиши сценарий буктрейлера.
ИИ генерит 8-10 сцен по 10-15 секунд. Их можно использовать, можно продолжать диалог и подправить на ваш вкус. Дальше ChatGPT может посоветовать ,чем именно и что генерить. Например, так:
– ChatGPT: Если нужно: сделаю раскадровку, монтажные подсказки или текст для озвучки.
ВАЖНО! Сделать всё в одном приложении не получится. У меня получилось сделать буктрейлер из таких элементов.
- Сценарий
- Картинки цен и персонажей
- Оживление картинок
- Генерация голоса
- Связка голоса и персонажей
- Финальный монтаж
Спросить, чем и что это сделать, можно GPT (меня ИИ понимает даже с опечатками):
Поэкспериментировав, я решил, что проще будет сделать картинки сцен и оживить их. Короткие видео по сценарию GPT генерились криво.
Например, в одной сцене на столе нужно было опрокинуть чашку кофе, который разливается на книгу и документы. Gemini, ИИ от Гугла, вообще отказался делать такую сцену, назвав ее “деструктивным действием”. А Pika Labs, которую рекомендовал ChatGPT, почему-то переворачивала чашку наоборот: чашка вставала из лежачего положения. Но Pika Labs оказался единственным инструментом, от которого пришлось отказаться.
В итоге я решил сделать картинки сцен и оживить их. В том же ChatGPT я использовал такие промты:
- Напиши промт сцены картинки для сцены №1
далее
- Нарисуй картинку по промту (ну и вставляешь промт)
Чуть на забыл, выбор интересных глав тоже можно верить нейросети.
Можно сразу попросить нарисовать картинку, и это тоже работает, но я экспериментировал с разными ИИ.
Далее по моей задумке сцены должны были перебиваться цитатами из книги. Также просим ChatGPT:
- Подбери цитаты из книги для сцен
В итоге теперь есть картинки сцен и цитаты, нужно оживлять.
Оживление картинок
Здесь методом проб и ошибок подобрал нейросеть RunWay (https://app.runwayml.com/)
Промты писал сам на английском, типа: люди на фоне бегут (и в переводчик).
По большому счету на этом этапе можно было и закончить, смонтировав перебивку картинок и цитат под бодрую музычку в CapCut. Но мне хотелось добавить людей с отзывами.
Персонажи с отзывами
Те, кто писал, наверняка знают, как сложно получить обратку от первых бета-ридеров. У меня из десяти человек, которые согласились, обратную связь дали всего трое.
Короче, нужно было добавить потенциальных эмоций от прочтения. Нет реальных - генерим (Fake it till you make it). Задаем ChatGPT задачу прописать потенциальную целевую аудиторию и на основе нее – образы читателей.
На основе образов – фото (бабка за дедку, дедка за репку). Итог – имеем фото персонажа.
Получается как-то так
Можно поработать над фото
Далее на основе образа персонажа генерим отзывы.
Озвучка и сведение
Самая реалистичная озвучка – у ElevenLabs (https://elevenlabs.io/)
Там есть хорошая фишка с эмоциями, это паузы театральные, изменения интонации и вздохи.
Связка голоса и фото через HyGen (https://app.heygen.com/)
Окончатльный монтаж
Собрал все в CapCut, музыку взял из внутренней библиотеки (тут нужно следить, чтоб было открытое использование иначе Ютуб блокирует). Кстати, тот же ChatGPT советовал генерить музыку нейросетью, но я уже поленился.
Общее время включая исследования, пробы и ошибки – дней 5. По деньгам – самый дорогой ChatGPT: 20 долларов в месяц. Остальное 12-15 USD. В итоге стоит рассчитывать долларов на 60-70. С пониманием инструментов сейчас можно сгенерить ролик часа за три-четыре.
Из сложностей
- Главная проблема – иностранная карта для оплаты сервисов.
- Долго и безрезультатно провозился с Pika Labs
- Сценарий, который пишет GPT, нужно максимально упрощать, иначе в попытках добиться “киношного эффекта” процесс затянется до бесконечности.
Сервисы списком
- Сценарий на основе анализа текста книги - https://chatgpt.com/
- Цитаты из книги - https://chatgpt.com/
- Картинки и персонажи - https://chatgpt.com/
- Оживление картинок - https://app.runwayml.com/
- Генерация голоса персонажей - https://elevenlabs.io/
- Связка персонажа и голоса https://app.heygen.com/
- Монтаж - CapCut
Вот что у меня в итоге получилось