Как создавать игровые ассеты с помощью AI: практическое руководство для инди-разработчиков
Я в свободное время интересуюсь GameDev направлением. Недавно столкнулся с тем, что сделать какой-нибудь простенький 3-match не так сложно, кроме истории с визуалом (UX). Парочка хороших паков иконок либо сложно купить внутри РФ, либо стоят дорого.
У меня был опыт работы с генеративными моделями по иллюстрациям, и возникла мысль: почему бы не попробовать сделать ассеты для прототипа? Инди-разработка игр часто упирается в бюджет, и генерация игровых ассетов через AI может сэкономить сотни долларов (звучит в теории).
Ниже расскажу, к чему привела AI-генерация, какие косяки словил, сколько это реально стоит и когда это вообще имеет смысл. Плюс готовые промпты, которые можно взять и использовать.
Дисклаймер касательно художников
Сугубо моё личное мнение – если человек ни разу в жизни не был разработчиком игр, и помимо того, что он должен осознать, как всё это запрограммировать, продумать геймдизайн, понять требования площадок и сделать что-то работающее на разных платформах, – схитрить на создание UX, как по мне, норма. Человек и так потратит уйму времени во всё это дело.
При этом опыт, насмотренность, чутьё реального художника, который лучше поймёт нужный вайб, подберёт что-то уникальное и сделает прям качественно, – это необходимость для чувака из первого абзаца, если ему понравится заниматься инди-разработкой и делать игры дальше.
Про ситуацию с художниками на рынке
У меня супруга работает в GameDev-студии, я вакансии специально проанализировал – везде сейчас требование по умению работать с GenAI (image-2-image, ComfyUI, pipeline-создание и так далее). Уверен, что инструмент в значительной степени их усиливает.
Никуда не денется эта роль, и я уверен, что проекты, которые будут «западать» в сердце, в первую очередь должны быть сделаны с любовью и людьми, но без каких-либо ограничений касательно инструментов и подходов.
Зачем генерировать ассеты вместо покупки
Генерация игровых ассетов с помощью нейросетей – это в первую очередь развитие собственного опыта осознанности, где AI может помочь, а где на него полагаться не стоит. Для инди-разработки игр это способ конкурировать со студиями, у которых есть штатные художники. Нейросеть для создания картинок позволяет одному разработчику создавать контент, на который раньше требовалась целая команда.
Есть сценарии, где это выгодно, и есть где – нет. Вот табличка, которую я для себя составил:
Юнит-экономика для 100 иконок
- Asset Store: 2-4 пака × $20 = $40-80 + время на поиск совместимых стилей
- Фрилансер: $200-400 + 2-3 недели ожидания + риск переделок
- AI: Sora / StableDiffusion + 5-8 часов работы (генерация + постобработка). Можно вообще обойтись free-тарифом (5 попыток в день) и потихоньку в течение недели ковырять. Или локально без лимитов через ComfyUI.
Где AI выигрывает
- Нужен единый стиль для всех элементов (генерируешь одной сеткой), можно указывать референс
- Делаешь прототип/MVP – не критично, если не идеально
- Бюджет ограничен, но время есть
- Нужны вариации одного и того же (переделать цвет, форму)
Где AI проигрывает
- Pixel art – AI не понимает ограничения палитры, будет замыливать пиксели
- Персонажи с лицами – нужна консистентность между кадрами, это сложно
- Проекты с высокими требованиями к качеству (типа A+)
Из 10 генераций 6-7 будут браком. Либо объекты сливаются, либо пропорции кривые, либо цвета не те. Тут просто reroll-практика.
Как я пришёл к «шаблону промпта»
Первые попытки были провальные. Я писал в лоб: «нарисуй фрукты для игры», и получал что угодно, но не то, что нужно.
Проблемы первых генераций
- Фон не белый, а градиентный
- Объекты разного размера
- Тени слишком жёсткие или вообще отсутствуют
- Стиль каждый раз разный
Начал добавлять детали: «cartoon style», «glossy finish», «white background». Стало лучше, но всё равно нестабильно.
Что я заметил
- Визуальный стиль нужно описывать подробно: тип рендеринга (3D/2D), финиш (глянцевый/матовый), форма объектов (мягкие края vs острые)
- Освещение критично: «soft ambient lighting» даёт совсем другой результат, чем «harsh directional light»
- Композиция – если не указать, что объект должен занимать 60-70% кадра, он будет теряться
Универсальный шаблон (preset) промпта, который использую для всех ассетов. Вот его основа:
Create a 3D illustration in the distinctive minimalist style. VISUAL STYLE SPECIFICATIONS: - 3D soft-body rendered objects with smooth, flowing surfaces - Clean, slightly rounded geometric form with zero sharp edges - Soft lighting with subtle shadows - Glossy matte finish on all surfaces - Professional product illustration aesthetic RENDERING CHARACTERISTICS: - Highly polished, smooth surface finish - Soft ambient lighting that wraps around the subject - Subtle specular highlights creating gentle reflections - Gentle shadow beneath object - Professional 3D rendering quality COMPOSITION RULES: - Center the subject in frame - Minimal negative space (object should occupy 50-70% of frame) - 1:1 ratio - Pure white or very light off-white background - No text, watermarks, or brand elements - Single focused subject per image OBJECT DESIGN PRINCIPLES: - Organic but geometric forms - Symmetrical or balanced asymmetry - Playful, slightly whimsical proportions - Details should be subtle and refined - No gritty textures or rough surfaces
Если нужно 2D – то поменять вместо 3D.
Сейчас просто копирую его и меняю пару строк – что рисовать, какие цвета. Работает стабильнее, чем я ожидал.
Почему grid, а не отдельные элементы
Когда генерируешь иконки по одной, каждая будет чуть-чуть отличаться по стилю – освещение разное, углы разные, толщина контуров разная. Если делать сетку 2×2 или 2×3, всё генерируется за один раз → стиль идентичный → остаётся только вырезать.
Тут нюанс: размер сетки имеет значение! По моему опыту с GPT-4o:
- ✅ 2×2 (4 элемента) – оптимально, брака почти нет
- ✅ 2×3 (6 элементов) – работает стабильно
- ⚠ 3×3 (9 элементов) – начинаются проблемы, может потребоваться 2-3 итерации
- ❌ 4×4 (16 элементов) – высокий процент брака, элементы сливаются
Это эмпирические наблюдения, официальных ограничений размеру сеток OpenAI не публикует.
Я сначала пробовал сразу 4×4, чтобы за раз получить много вариантов. Половина была непригодна – фрукты наползали друг на друга, цвета смешивались. Перешёл на 2×2, стало гораздо стабильнее.
Плюс экономия: вместо 20 отдельных генераций делаешь 5 сеток по 4 элемента. Меньше запросов → меньше времени → не упираешься в лимиты.
Генерация ассетов для match-3: пошаговый процесс
Рассказываю на примере, как я делаю набор иконок. Весь процесс занимает 40-60 минут на набор из 20 элементов.
Шаг 1: Поиск референсов (15 мин)
Захожу в Asset Store или Pinterest, ищу игры в похожем стиле. Мне не нужно скачивать – просто смотрю:
- Какой стиль преобладает (мультяшный/реалистичный/глянцевый)
- Какие цвета используются
- Есть ли контуры, тени, блики
Сохраняю 3-5 примеров, которые нравятся.
Шаг 2: Подготовка промпта (10 мин)
Беру свой базовый шаблон, добавляю специфику:
- Что рисуем (фрукты, конфеты, кристаллы)
- Сколько элементов и в какой раскладке (2×2)
- Какие цвета должны быть
- Особенности стиля (cartoon, glossy, 2D/3D)
Шаг 3: Генерация (5-10 мин на попытку)
Закидываю промпт, жду 30-60 секунд. Смотрю результат:
- Если ОК – сохраняю
- Если не то – правлю промпт, генерирую снова
Обычно делаю 2-3 итерации, пока не получится приемлемый результат. На выходе – изображение с сеткой 2×2.
Шаг 4: Апскейл (опционально, 10-15 мин)
Генерация даёт низкое разрешение (1024×1024 на всю сетку → ещё меньше на каждый элемент). Для мобильных игр норм, для десктопа маловато.
Использую:
- Topaz Gigapixel – лучшее качество
- img2img в Stable Diffusion – если умеешь настраивать и подбирать модели
- Либо любой сайт в поисковике по запросу «upscale image» (есть куча бесплатных)
Апскейл в 2× занимает 1-2 минуты на сетку.
Шаг 5: Отбор и вырезка (15-20 мин)
Открываю Photoshop (или GIMP, если бесплатно):
- Разрезаю сетку на отдельные элементы
- Убираю фон (Magic Wand Tool или слой-маска)
- Сохраняю каждую иконку как отдельный PNG
На один элемент уходит 3-5 минут, если фон простой.
Готовые промпты для нейросети: примеры для игровых ассетов
Пример 1: Фрукты для match-3 (cartoon style)
A 2×2 grid of game fruit icons: top row shows 1 strawberry in red and 1 apple in green with shine; bottom row shows 1 orange in bright orange and 1 lemon in yellow. Cartoon 2D mobile game style, glossy finish with shine spots, white background, all fruits front-facing, equal size, separated by thin lines, ready for tile extraction.
Что тут важно:
- «2×2 grid» – указываю чёткую раскладку (важно для стабильности!)
- «equal size» – чтобы не было одного огромного яблока и крошечной клубники
- «separated by thin lines» – так легче резать в Photoshop
- «ready for tile extraction» – намекаю, что это должны быть отдельные объекты
Пример 2: Конфеты (глянцевый стиль)
Create a 2×2 grid of match-3 candies: Top row: red wrapped candy, blue lollipop Bottom row: yellow striped bonbon, green wrapped taffy Cartoon 2D mobile game style, glossy finish with shine, white background, equal square cells separated by thin gray lines, all candies same size, ready for sprite extraction.
Здесь добавил:
- Конкретные типы конфет (wrapped, lollipop, bonbon) – AI лучше понимает
- «square cells» – для match-3 важно, чтобы ячейки были квадратные
Пример 3: Кристаллы (3D стиль)
A 2×2 grid of magical crystals for match-3: Top row: purple amethyst crystal, blue sapphire gem Bottom row: red ruby stone, green emerald crystal 3D rendered style, polished glossy surface with internal glow, soft shadows, white background, geometric faceted shapes, equal size, centered in cells, grid layout with thin dividers.
Для кристаллов важно:
- «geometric faceted shapes» – чтобы были грани, а не гладкие шары
- «internal glow» – придаёт магический вид
Пример 4: Попытка сделать турнаунд
Турнаунд (turnaround) — это набор видов персонажа со всех основных ракурсов: фронт, профиль, спина, и часто 3/4 angle.
Character design sheet featuring the same character from multiple angles. TOP ROW (left to right): 1) Front view - facing camera, neutral pose, arms at sides 2) 3/4 LEFT angle - rotated 45 degrees left, slight turn 3) LEFT PROFILE - perfect side view, 90 degrees BOTTOM ROW: 1) 3/4 RIGHT angle - rotated 45 degrees right 2) RIGHT PROFILE - opposite side view, 90 degrees right 3) BACK view - facing away, back of character CHARACTER DESCRIPTION: A young ranger, human male, green hood, brown leather armor, sword at hip, confident stance. Consistent face, proportions, outfit across ALL views. TECHNICAL REQUIREMENTS: - Orthographic camera (flat, no perspective distortion) - Equal character height in each cell - Consistent lighting from top-left across all views - White background with thin grid lines - No background scenery, pure character focus - Professional animation reference quality
Таблица стилей: что работает, что нет
На основе собственных 50+ попыток:
Если делаешь pixel art игру, лучше рисовать самому или покупать готовое. AI с этим не справляется.
Реальная окупаемость и процент брака
В среднем на подписке – $20/мес, хватает, чтобы не упираться часто в лимиты.
Если ты делаешь одну игру в квартал и чисто solo-разработка, это дорого получается по итогу. Если делаешь 2-3 проекта одновременно – окупается быстро.
Из 10 генераций:
- 5-6 – откровенное говно (объекты смазанные, цвета не те, композиция кривая)
- 1-2 – «почти то», но нужны правки (можно использовать с постобработкой)
- 1 – готовые к использованию с минимумом доработок
Это нормально. Просто закладывай время на переделки.
Время на обработку результата
В промптах пишут «5 минут на элемент» – вранье. Реально:
- Вырезать фон: 3-5 мин/элемент (если фон простой)
- Подправить края (сглаживание): 2-3 мин
- Апскейл: 1-2 мин
- Проверить, что всё ОК: 1 мин
Итого: на набор из 20 иконок уходит не 5 минут, а 2-3 часа с учётом генерации и обработки.
Хотя это всё равно быстрее, чем ждать фрилансера неделю.
Что не работает: ограничения AI
Pixel art
AI не понимает ограничения палитры. Если попросишь «8-bit style», он нарисует что-то похожее, но пиксели будут размытые, цвета – не из палитры. Проще нарисовать самому в Aseprite.
Персонажи с лицами
Если нужен один и тот же персонаж в разных позах – боль. Лицо каждый раз будет немного другое. Для этого нужны специальные инструменты типа consistent character в Midjourney или обучать свою LoRA в Stable Diffusion.
Сложные сетки >6 элементов
Пробовал делать 4×4 (16 элементов) – половина была непригодна. Элементы сливаются, цвета смешиваются, пропорции плывут. 2×2 или 2×3 – оптимум.
Необходимый софт для обработки
- Photoshop ($10-20/мес) – самый удобный вариант
- GIMP (бесплатно) – работает, но менее удобно
- Figma – можно вырезать простые объекты, но нет нормальных масок
Плюс апскейл-инструменты, если нужно высокое разрешение – писал выше.
Юридические нюансы
Можно ли использовать AI-ассеты в коммерческих играх? По ToS OpenAI – можно, сгенерированный контент принадлежит тебе. Но есть нюанс: если твои ассеты случайно будут похожи на контент из игр популярных издателей – могут быть вопросы.
Хотя, если честно, для инди-игр риск минимальный. Никто не будет придираться к иконкам фруктов. Наверное...
Другие AI-инструменты для игровой графики
Кроме Sora есть альтернативы. Если вы ищете другие варианты для создания ассетов для игр, вот что я пробовал:
Leonardo AI
Плюсы:
- Точный контроль через параметры (guidance scale, ControlNet)
- Лучше для концепт-арта и иллюстраций
- Есть бесплатный тариф (150 токенов/день ≈ 10-12 изображений)
Минусы:
- Для иконок overkill – слишком много настроек
- Нужно разбираться в параметрах
Когда использовать: если делаешь концепт-арт или персонажей и нет собственной мощной видеокарты.
Stable Diffusion (ComfyUI)
Плюсы:
- Бесплатно (если запускаешь локально)
- Полный контроль через параметры и модели
- Можно обучить свою LoRA под конкретный стиль (ну либо найти на просторах подходящее)
Минусы:
- Нужна нормальная видеокарта (минимум RTX 3060)
- Крутая кривая обучения
- Много времени на настройку
Когда использовать: если ты технарь и хочешь полный контроль. Ну либо если других вариантов нет.
Midjourney
Плюсы:
- Хорошее качество, особенно для художественных стилей
- Очень стабильная генерация
Минусы:
- Дорого ($10-120/мес в зависимости от плана)
- Через Discord – не всем удобно
- Хуже с техническими стилями (UI, иконки)
Когда использовать: если нужен wow-эффект для маркетинговых материалов.
Мой выбор: Пока хватает Sora и ComfyUI.
Ещё AI-инструменты можно, например, использовать для создания локализации с поддержкой контекста, рассказывал ранее, как это сделать через n8n.
Резюме
Если коротко: AI для ассетов работает, но не для всего. Генерация игровых ассетов с помощью нейросети для создания картинок – это не замена художнику, но мощный инструмент для инди-разработки игр. Особенно если делаешь прототип, MVP или casual игру с ограниченным бюджетом.
Думаю, что спонтанная идея потратить ~15 часов на изучение промптов для нейросети и экспериментов с разными стилями вполне окупилась и пригодится мне в будущем. Надеюсь, когда-нибудь всё же сделать собственную игру.
А вы пробовали генерировать ассеты? Какие инструменты используете для создания ассетов для игр? Или считаете, что AI – это зло и нужно поддерживать художников? Делитесь в комментах!