Как создать персонажа с помощью нейросетей. Пошаговый гайд

Рассказываю о том, как создать персонажа с помощью ИИ: от генерации аватара до придумывания идей и полноценной анимации. Дам список инструментов и пошаговый план действий, а также несколько полезных советов и рекомендаций. Персонаж с превью мой.

Всем привет! Меня зовут Борис, я основатель проекта "Нейронавигатор" - Телеграм-бота для изучения нейросетей с обучающими материалами и встроенными ИИ-моделями для удобной работы прямо в мессенджере.

Для всех новых пользователей мы предоставляем:

🤖 Бесплатный ChatGPT без ограничений и VPN
📚 300+ готовых промптов: протестированные шаблоны для работы с текстом, фото, видео и музыкой
💡 ТОП-100 нейросетей для работы прямо сейчас
🎓 База знаний: простые инструкции по работе с ИИ

Переходите по ссылке и получите все эти материалы:
https://t.me/NeuroNavigator_bot

Этот гайд возник спонтанно, когда я наткнулся на отличный промпт для создания персонажей в Midjourney. Он позволяет создавать мультяшных персонажей без особых усилий: достаточно написать одно слово и получить похожий результат:

Вот промпт:

a cartoon face of a [персонаж], in the style of rendered in unreal engine, playful character designs, playful colored background, toy-like proportions --ar 1:1 --v 6.1

Вариации (добавьте это слово вместо квадратных скобок):
1. hunter
2. fire fighter
3. clown
4. witch
5. chef
6. detective
7. busker
8. surfer
9. priest

Как вы могли понять из превью, я выбрал эту ведьму за основу:

Все изображения созданы с помощью Midjourney - это основной инструмент в этом гайде. Благодаря нему вы сможете переносить лица с одного изображения на другие.

Способ № 1: На официальном сайте

Перейдите на официальный сайт https://midjourney.com, пройдите легкую регистрацию, оплатите любой тариф (от 10$/мес) и можете начать генерировать. Сайт предназначен для работы с ПК или ноутбука. Вам потребуется иностранная карта для оплаты (по понятным причинам).

Способ № 2: С помощью Телеграм-бота

В мессенджере вы можете найти множество Телеграм-ботов, которые предоставляют доступ к Midjourney. Например, в моем боте "Нейронавигатор" встроена последняя модель Midjourney 6.1, а купить запросы можно от 500 рублей (они не сгорают и не требуют никаких дополнительных подписок). Этот способ подойдет для работы с любого устройства, даже со смартфона или планшета.

Далее в гайде я буду использовать свой Телеграм-бот. Выбранный способ никак не повлияет на сам процесс, ведь ИИ-модель работает везде одинаково.

Этот этап необязателен, но в целях демонстрации возможностей Midjourney я создам персонажа в полный рост - с сохранением особенностей и черт лица. Для этого нам понадобится параметр --cref, который позволяет переносить персонажа с одной генерации на другую.

Параметр --CREF работает очень просто:

1. Вы загружаете изображение с персонажем на любой хостинг, чтобы получить постоянную ссылку.
2. В конце промпта добавляете текстом "--cref" и указываете полученную ссылку.
3. Midjourney будет учитывать это изображение в последующих генерациях.

В Нейронавигаторе можно загрузить изображение и написать боту "дай ссылку", чтобы получить постоянную ссылку:

Теперь поменяем первоначальный промт. Я хочу создать персонажа в полный рост, поэтому заменю "cartoon face" на "cartoon full-body" и изменю соотношение сторон на --ar 2:3 или --ar 9:16 (расскажу о пропорциях подробнее, но чуть позже).

Отредактированный промт:

a cartoon full-body of a witch, in the style of rendered in unreal engine, playful character designs, purple eyes, playful purple background, toy-like proportions --ar 9:16 --cref https://img.pxsto.re/6985ee000d07ee07.png --v 6.1

Через пару минут получаем такой результат:

Это первая генерация, и в глаза сразу бросаются две неточности:

1. В исходном изображении более "плоский" стиль, тогда как в новом появилась игра света и тени, из-за чего персонаж выглядит более объемным и 3D-шным.
2. Это не совсем full-body (полный рост), ведь ноги не попали целиком.

Как исправить:

1. Используем еще один полезный параметр Midjourney --sref (с той же ссылкой), который предназначен для переноса стиля с исходного изображения. Работает по тому же принципу, как и перенос персонажа.

2. Чтобы персонаж всегда был в полный рост, просто укажите в промте обувь 👠. Так мы заставим нейросеть включать этот элемент в каждое изображение (годный лайфхак).

Отредактированный промт:

a cartoon full-body of a witch, in the style of rendered in unreal engine, playful character designs, purple eyes, wearing black shoes, playful purple background, toy-like proportions --ar 9:16 --cref https://img.pxsto.re/6985ee000d07ee07.png --sref https://img.pxsto.re/6985ee000d07ee07.png --v 6.1 --fast

И вот что получилось:

Новые изображения еще больше похожи на исходник, и теперь она стоит в полный рост. Но некоторые детали всё ещё отличаются.

Я создал более тысячи изображений и могу точно сказать, что Midjourney переносит около 60-70% черт персонажа и легко теряет важные детали, например цвет глаз, форму лица, прическу, одежду и т.д. В текущей версии практически невозможно получить 100% совпадения (если у вас получилось, покупайте лотерейный билет, сегодня ваш день). Но есть пара дельных советов, как достичь 90% сходства во всех генерациях:

Советы для повышения идентичности:

Пропишите в промпте цвет глаз. В своем примере я указал "purple eyes" (фиолетовые глаза). Этот элемент срабатывает в 99% случаев и сразу дает ощутимую прибавку к идентичности.
Укажите дополнительные детали. Например, я бы мог дополнить свой промпт и указать "оранжевый бантик", чтобы этот важный элемент одежды всегда переносился с одной генерации на другую.
Экспериментируйте с позами, ракурсом и настроением. Удивление, страх, радость, смех — всё это лучше раскрывает персонажа и отвлекает внимание от поиска различий.
Используйте параметр --sref. Как вы могли увидеть, перенос стиля тоже имеет значение.
Упрощайте персонажа. Например, обычная "черно-белая панда в стиле фотореализм" почти всегда выглядит одинаково.
Пробуйте несколько раз. Не унывайте, если не получилось с первого раза, это нормально. Иногда требуется от 2 до 5 попыток для получения нужного результата.

Персонаж готов, и теперь начинается очень увлекательный процесс: придумывание сюжета и идей. Если вы творческий человек и налету генерируете новые идеи, а также свободно говорите на английском языке, для вас это будет простой задачей. А если нет?

Я пишу промты на английском языке (так ИИ лучше понимает контекст), но не могу сказать, что владею им свободно. Для перевода с русского на английский я часто использую ИИ-переводчик DeepL:

1. Перейдите на сайт https://www.deepl.com/
2. Напишите свою идею на русском языке
3. Получите перевод на английский и вставьте в промт

А если совсем нет идей, доверьте эту задачу ChatGPT. Напишите ему:

Я генерирую персонажа с помощью Midjourney. Твоя задача: придумать 10 описаний сцен на английском языке, где мой персонаж взаимодействует с объектами и выражает эмоции. Тема: [ведьма на Хэллоуин]. Вот хорошие примеры: [тут приведите пример описания сцены].

ChatGPT выдал мне список из 10 идей:

Беру первые попавшиеся и проверяю в Midjourney:

Отредактированный промпт:

[ПЕРСОНАЖ + СЦЕНА, например: A cartoon witch reading an ancient spellbook, her expression a mix of curiosity and excitement], in the style of rendered in unreal engine, playful character designs, purple eyes, toy-like proportions --ar 16:9 --cref https://img.pxsto.re/72a36d99a102d943.png --sref https://img.pxsto.re/c367fbed988c44a1.png --v 6.1

И вот результат:

Сцена: A cartoon witch reading an ancient spellbook, her expression a mix of curiosity and excitement

Сцена: A cartoon witch creating sparkles with her wand, creating playful shapes in the air while her cat watches in awe, tail twitching

Сцена: A cartoon witch playfully juggling pumpkins in a pumpkin patch, laughter echoing as she tries to catch them with her open arms

Сцена: A cartoon witch brewing a glowing potion in a bubbling cauldron, colorful sparks flying around her with a cheeky smile on her face

Сцена: A cartoon witch sitting on a crescent moon

Сцена: A cartoon witch surrounded by friendly bats, playfully trying to catch them in mid-air as they flutter around her with mischievous expressions

Все изображения были получены с первого раза. Я доволен результатом и оставил как есть, хотя в некоторых случаях потребуется несколько попыток (например, если вы очень критично относитесь к разнице в одежде или форме зубов).

Вы могли заметить, что я применяю одно и то же соотношение сторон (--ar 16:9) для всех генераций. Почему?

Ответ простой: чтобы в будущем создать короткометражный ИИ-мультфильм. Это соотношение лучше всего подходит под YouTube, и мне будет удобно склеивать анимированные изображения в видеоредакторе без потери качества и деталей.
Но если вы делаете персонажа для других целей, то вот вам шпаргалка по соотношению сторон:

16:9 — идеальное соотношение для YouTube; используется для горизонтального видео
1:1 — классический квадратный формат, отлично подходит для ИГ и ФБ, а также для создания стикеров в Telegram
4:5 — вертикальный формат для постов в ИГ, даёт больше пространства на экранах смартфонов
2:3 — более длинный вертикальный формат, хороший для изображений Pinterest
9:16 — оптимальный формат для TikTok и сторис в ИГ; идеально подходит для вертикального видео.

Это наиболее часто используемые форматы, хотя Midjourney в этом плане очень гибок и позволяет задавать другие значения, например --ar 78:128 или любые другие пропорции.

Для этой задачи потребуются нейросети для создания коротких видеороликов (обычно длиной 5-10 секунд). Наиболее популярные из них: Hailuo AI Minimax, Kling, Runway, Pika, Luma Dream Machine, Vidu (расставил по частоте использования).

Все эти сервисы дают возможность анимировать изображения бесплатно, но с ожиданием в очереди и с наложением водяного знака. В моего бота встроен Kling для создания простых анимаций: платно, но зато быстро и без водяных знаков. Достаточно загрузить одно изображение как начальный кадр (или прикрепить сразу два, тогда они будут начальным и конечным кадром) и написать команду /kling (можно продублировать промпт, который содержит описание сцены, хотя это не обязательно, нейросеть придумает всё за вас):

А вот и результат:

И еще один:

Получилось неплохо для генерации с первого раза, но я бы попробовал еще. Любой понравившийися фрагмент можно продлить на 5 секунд (общая продолжительность до 2 минут).

С этим чуть сложнее, т.к. нейронки плохо справляются с этой задачей (субъективное мнение). Но недавно Runway выпустил новую функцию Act One, которая предназначена именно для этого. Вы можете записать видео с самим собой, и персонаж начнет говорить вашим голосом и синхронно двигать губами. Вот пример из Твиттера:

Я ее еще не достаточно изучил, пробовал всего несколько раз. Например, за основу взял мем и вот что получилось:

Получилось не то, что я ожидал. Думаю, это из-за неудачно подобранного видео (слишком низкое качество). В идеале записать видео самостоятельно и в хорошем качестве, но я сделаю это в следующий раз.

Я добавил большую подборку готовых промптов для создания персонажей. Она доступна бесплатно всем желающим в моем боте. достаточно отправить боту слово "персонажи" или перейти в раздел "Библиотека промтов" - "Изображения" - "Люди и персонажи". Там вы найдете около 30 рабочих промптов с различными вариациями, которые позволят создать персонажа на любой вкус и цвет:

Ссылка на бота: https://t.me/NeuroNavigator_bot

На этом пока всё. Я бы мог написать еще больше про анимацию, т.к. там очень много подводных камней и ограничений, о которых нужно знать. Но это будет в следующий раз, когда (и если) я начну создавать полноценный мультфильм на основе этого персонажа. Небольшой спойлер: это очень трудоемкий и дорогой процесс. Если очень хотите, поставьте лайк и напишите комментарий, это будет дополнительной мотивацией.

Буду рад обсудить все детали в моем Телеграм-канале: Boris AI – нейросети для работы и хобби. Он новый и там пока мало людей, поэтому смогу ответить на все ваши вопросы. Спасибо, что дочитали до конца и удачных генераций!

t.me

Boris AI – нейросети для работы и хобби

Как создать персонажа с помощью нейросетей. Пошаговый гайд

Как воспользоваться Midjourney

Создаем персонажа в полный рост

Ограничения параметра --cref

Начинаем придумывать сцены

Как выбрать правильное соотношение сторон

Как анимировать персонажа

Озвучивание и синхронизация губ

Где искать промпты для персонажей