Как мы отставили панику и создали 300 (да-да, 300!) обложек к рассказам за месяц с помощью Midjourney

Триста обложек? Зачем столько? Всё просто: осенью 2022 года мы — команда людей, никогда не имевших отношения к издательскому делу, — создали проект «Прочитано». Это бесплатная онлайн-библиотека коротких русскоязычных рассказов на 2—10 минут чтения: рассказов, в которые можно погрузиться за чашкой кофе. Все мы помним с детства, что текст с картинками читается легче, поэтому создание иллюстрации-обложки к каждому из трёхсот стартовых рассказов (а мы решили, что именно столько будет достаточно для запуска сайта) было обязательной частью визуала.

Февраль 2023: стартовые рассказы отредактированы, откорректированы, готовы к публикации. Ну, почти готовы: не хватает обложек. Запуск проекта — март 2023.

Задача: отрисовать триста нестыдных картинок за месяц. Смешно? На тот момент нам было не очень.

Варианты:

  • Нанимать иллюстраторов. «Нереально», — сразу отмели мы. Дорого, долго, каждый рассказ — уникальный, со своей атмосферой и стилистикой. Кроме того, мы с самого начала определились, что после запуска библиотека будет пополняться новыми рассказами каждый день — просто физически невозможно будет поддерживать темпы публикаций.
  • Искать другие решения.

А других решений оказалось не так-то и много: не справится интеллект естественный — пойдём к искусственному. По сути, нужно было решить для себя этическое «да/нет ИИ» и выбрать наиболее удобную из активно развивавшихся в тот момент нейросетей.

Попробовали Stable Diffusion, попробовали Midjourney — и остановились на второй. Тогда она показалась нам более удобной и понятной (спойлер: мы ни о чём не пожалели).

От теории к практике

Итак, для себя мы решили, что каждая иллюстрация должна:

— быть красивой;

— быть оригинальной;

— отражать дух текста;

— не обманывать читателя;

— передавать задумку автора рассказа.

Иллюстрация к рассказу <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fgramotnym-byt-e28094-modno%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D0%25B3%25D1%2580%25D0%25B0%25D0%25BC%25D0%25BE%25D1%2582%25D0%25BD%25D1%258B%25D0%25BC&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«Грамотным быть — модно!»</a>
Иллюстрация к рассказу «Грамотным быть — модно!»

Как это сделать?

В нашем случае обозначилось два пути, выбор которых зависел от того, были ли у автора пожелания по обложке или нет (при заключении договора мы предлагаем писателям рассказать нам о своём видении).

Если пожелания были, нам оставалось перевести их на язык, понятный нейросети (об этом чуть позже).

Если нет, опытным путём мы выработали алгоритм, которому следуем до сих пор:

1. Читаем рассказ.

2. Решаем, какой атмосферой, духом должна обладать иллюстрация, чтобы читатель, взглянув на неё, сразу понял, с каким настроением будет рассказ — или, наоборот, мог по обложке подобрать рассказ под своё настроение. Так, комедии часто подходят карикатуры, лиричному тексту — импрессионисты; рассказ о первобытных людях получает обложку в виде наскальной живописи, а тёплая деревенская история подсказывает обратиться к гжели.

Иллюстрация к рассказу <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fu-vas-tovare280a6%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D1%2583%2520%25D0%25B2%25D0%25B0%25D1%2581%2520%25D1%2582%25D0%25BE%25D0%25B2%25D0%25B0%25D1%2580&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«У вас товар...»</a>
Иллюстрация к рассказу «У вас товар...»
Иллюстрация к рассказу <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fte-zhe-palki-tolko-v-profil%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D1%2582%25D0%25B5%2520%25D0%25B6%25D0%25B5%2520%25D0%25BF%25D0%25B0%25D0%25BB%25D0%25BA%25D0%25B8&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«Те же палки»</a>
Иллюстрация к рассказу «Те же палки»

3. Подбираем референсы стилистики. Под стилистикой здесь мы можем понимать самые разные вещи: материалы и техники, художников, фотографов, кинорежиссёров, собственно стили и жанры. Для поиска подходящих идей мы часто пользуемся библиотеками стилей, которые есть в свободном доступе и за которые мы очень признательны их создателям: https://midlibrary.io/categories и https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference/tree/main

4. Формулируем запрос. В практике нейросетей он называется «промт» (prompt) и содержит ключевые слова, по которым ИИ понимает, что мы от него хотим.

5. Формируем итог. Иногда картинке от Миджорни всё же необходимо человеческое вмешательство, и тогда наш графический дизайнер дорисовывает некоторые элементы, доделывает надписи, убирает лишние пальцы и прочие конечности.

Обложка рассказа <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fsvidanie%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D1%2581%25D0%25B2%25D0%25B8%25D0%25B4%25D0%25B0%25D0%25BD%25D0%25B8%25D0%25B5&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«Свидание»</a>: дизайнер вручную добавил текст
Обложка рассказа «Свидание»: дизайнер вручную добавил текст

Ну вот, собственно, и всё.

Пройдя этот нехитрый путь триста раз, мы создали (и продолжаем создавать) уникальные иллюстрации, радующие читателей и писателей.

Поделимся некоторыми лайфхаками, которые родил наш уже богатый нейросетевой опыт.

Структура промта

Успех в работе с Миджорни по-прежнему на сто процентов зависит от удачного промта. Чтобы добиться нужного результата, иногда приходится как следует поиграться с формулировками.

Как правило, структура нашего запроса выглядит так: объект, его детали и действия, обстановка, параметры кадра (ракурс, освещение, настройки камеры), стилистика.

Тогда промты получаются длинными:

<p><b>«a black silhouette of a man in a suit and in a helmet with a lot of wires and tubes from helmet with his back to us in front of a bright cyberpank futuristic landscape in green colours by Enoch Bolles»</b> (рассказ <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fgugol%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D0%25B3%25D1%2583%25D0%25B3%25D0%25BE%25D0%25BB&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«Гугол»</a>)</p>

«a black silhouette of a man in a suit and in a helmet with a lot of wires and tubes from helmet with his back to us in front of a bright cyberpank futuristic landscape in green colours by Enoch Bolles» (рассказ «Гугол»)

Но иногда наша задумка проста и рождает совсем короткий очевидный запрос:

<p><b>«Pharaoh is playing a computer game, mosaic»</b> (рассказ <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fprochitano.ru%2Frasskazi%2Fistoricheskaya-pobeda%3Fotkuda%3Dfilter%26amp%3Bpoisk%3D%25D0%25B8%25D1%2581%25D1%2582%25D0%25BE%25D1%2580%25D0%25B8%25D1%2587%25D0%25B5%25D1%2581%25D0%25BA%25D0%25B0%25D1%258F%2520%25D0%25BF%25D0%25BE%25D0%25B1%25D0%25B5&postId=870666" rel="nofollow noreferrer noopener" target="_blank">«Историческая победа»</a>)</p>

«Pharaoh is playing a computer game, mosaic» (рассказ «Историческая победа»)

Основная задача — сформулировать промт таким образом, чтобы избежать двоякого прочтения (а нейронки это очень любят) и «достучаться» человеческими словами до машинных алгоритмов.

Например, запрос «fragments of a room — a table, a book, window sills :: gray red color scheme by Charles Angrand» выдаёт среди прочего случайно запрошенную нами цветовую схему (картинки 2 и 3):

Как мы отставили панику и создали 300 (да-да, 300!) обложек к рассказам за месяц с помощью Midjourney

Но мы, понимая, что это не совсем то, что нужно, убираем лишнее и на «fragments of a room — a table, a book, window sills :: gray red colors by Charles Angrand» получаем уже более чистое:

Как мы отставили панику и создали 300 (да-да, 300!) обложек к рассказам за месяц с помощью Midjourney

Стилистика — ключевой параметр запроса

Наше самое любимое — это, конечно, эксперименты со стилями. Вот какие разные результаты получились, например, по запросу «a happy boy in a school uniform with a bouquet of asters stands at the school»:

<p><b>...by C<span>hris Ware</span></b></p>

...by Chris Ware

<p><b>...by <span>Saul Steinberg</span></b></p>

...by Saul Steinberg

<b>...by <span>Charles Schulz</span></b>
...by Charles Schulz
<b>...by <span>Josh Agle</span></b>
...by Josh Agle

Или рассказ «Чары русалки» и результаты по запросу «a mermaid with blue hair sitting on a shelf in a train» с использованием стилей разных художников:

Играться с материалами и техниками — отдельное удовольствие:

  • Мозаика (mosaics)

  • Вышивка (embroidery)

  • Аппликация (paper cut craft)

  • Скетчноутинг (sketchnote style)

  • Пиксель-арт (pixel drawing)

  • Спиртовые чернила (alcohol ink)

  • Резьба по дереву (carving)

  • Латте-арт (latte art)

  • Оригами (origami)

  • Лоскутное шитьё (patchwork)

  • Картины из камней (pebble art)


Как подобрать стиль?

В процессе работы над обложками мы придумали для себя такой лайфхак: иногда мы идём от обратного — сперва выбираем художника, стиль которого нравится, а затем переходим в режим «крадущийся тигр, затаившийся дракон» и ждём, когда река принесёт подходящий под идею рассказ. А ещё составляем заметки с указанием имени художника, где отмечаем, для какого рода текста он подойдёт. Вот так они могут выглядеть:

Как мы отставили панику и создали 300 (да-да, 300!) обложек к рассказам за месяц с помощью Midjourney

Иногда мы исходим из буквального содержания текста и изображаем его главного героя, ключевой предмет или обстановку; но бывает, что рисуем через метафоры или просто настроение рассказа — в общем, всё как с обычными иллюстрациями.

В общем, работа с нейросетями — это эксперименты, эксперименты, сплошные эксперименты!

Увидеть результат нашего цифрового творчества, убедиться, насколько безграничны возможности нейронок и как грамотный визуал помогает в восприятии текста можно в библиотеке www.prochitano.ru. Все обложки созданы нейросетью. Вход в библиотеку свободный, тишины не требуем.

Желаем вам лёгких промтов, клёвых результатов и спасибо за внимание!

P.S. Сейчас у нас новая творческая задача: с помощью Stable Diffusion создаём крутые QR-коды, ведущие в нашу библиотеку. Но об этом расскажем в следующий раз ;)

Да-да, я рабочий куар! Только камеру отводим чуть подальше ;)
Да-да, я рабочий куар! Только камеру отводим чуть подальше ;)
1111
1 комментарий

Крутой лайфак с референсами для нейросети)

1
Ответить