Урок 1: Рисуем с помощью нейросети. Практика

Итак, первый шаг в удивительный и чудесный мир нейросетей сделан - мы знаем, что нейросети могут рисовать изображения по текстовому описанию. Двигаемся дальше.

Знание без практики - просто хлам в голове. А нам нужен навык, умение, тесное знакомство.

Надеюсь, вы уже пощупали функционал генерации картинок нейросетью самостоятельно и создали свои первые нейрокартины.

Если нет - ничего страшного. Простейший кейс, не требующий усилий со стороны вашей фантазии, но позволяющий быстро ознакомиться с возможностями нейросетей по созданию (генерации) картинок я привела, заставив нейросеть Midjourney иллюстрировать русские крылатые фразы.

Посмотреть можно здесь:

Но стоять на месте мы не собираемся, а потому двигаемся дальше. Углубляем и закрепляем навык.

Абстрактные запросы нейросети на генерацию картинок работают также, как и в случае с абстрактной постановкой задачи живому художнику или дизайнеру. Да-да, без внятного ТЗ результат ХЗ.

В человеческой среде мне не раз приходилось объяснять руководителям и собственников бизнеса, что нельзя требовать от сотрудников результата без торжественного вручения инструментов, алгоритмов и проведения обучения.

Хотите, чтобы Иван Иванов выкопал сегодня картошку? Тогда дайте ему лопату, ведро и ящики, отмерьте участок работы на огороде, разберите, как выглядит картофельный стебель, научите отличать его от лебеды и крапивы, разъясните, как подкапывать картофельный стебель, чтобы не повредить клубни, как разрывать землю руками, чтобы собрать урожай полностью, как отличить хорошие клубни от гнилых, покажите, как складывать в ведро и пересыпать в ящик, чтобы картошка не повредилась и была пригодна для долгого хранения. Уточните, к какому времени работа должна быть закончена и опишите, где и в каком виде должен к этому времени быть размещен собранный урожай.

С нейросетями так же. Множество людей попробовали использовать инструменты нейросетей, но после нескольких попыток получили неожиданный результат и бросили это дело.

"Тупая эта ваша хваленая нейросеть!" - сказали они и ушли в закат делать рутинные задачи руками, по старинке, убивая уйму времени и сил.

Что могу сказать?

"Тупые" нейросети, выстроенные на математических алгоритмах, с фантастической для человека скоростью обучаются. Так, что несмотря на свою техническую природу уже понимают человеческий язык общения, а не только нолики, единички, программерские абракадабры и прочие коды.

Да, нейросети пока не волшебники, а только учатся. И все еще не экстрасенсы, а значит не знают, какую картину результата нарисовали у себя в голове, до тех пор, пока вы не разложите все по полочкам. А значит, если результат обработки запроса выходит далеким-далеким от ожидаемого, проблема не в нейросети, а в сигнале, команде, которую дает ей homo sapiens, сидящий по ту сторону экрана.

Поэтому, хотя нейросети и человек обладают разными навыками и способностями (мы рассмотрим эти отличия в следующем уроке), я рекомендую всем гуманитариям очеловечивать нейросеть во время работы с ней, да простят меня любимые мной технари.

Да-да. Общайтесь с нейросетью, как с любимым ребенком, учеником, студентом, другом, который вообще не компетентен в предлагаемой области знаний, бабушкой, которой объясняете, как пользоваться смартфоном, младшим коллегой, чьим наставником являетесь, - как с любым человеком, от которого хотите получить предсказуемый результат вследствие выполнения определенного действия. По большому счету, ей-то все равно, как вы к ней относитесь...Но как только вы представите себе, что объясняете задание живому, который вообще не в теме, сможете сможете сформировать запрос куда эффективнее - так уж работает человеческая психика.

Пора попробовать. Итак, нам нужна картинка по точному описанию. Что бы это могло быть? Предлагаю пока отложить фантазию и дать нейросети уже существующие описания.

А не обратиться ли нам к героям классической литературы?

Пример 1. Булгаковская Маргарита

Что имеем у автора?

..Бездетная тридцатилетняя Маргарита.. красива и умна.....короткие завитые волосы...парикмахерская завивка...тонкие с остро отточенными ногтями пальцы..ощипанные по краям в ниточку пинцетом брови.. на хорошо одетую женщину...женщине, в глазах которой всегда горел какой‑то непонятный огонечек...косящей на один глаз ведьме..(цитаты из романа М.Булгакова "Мастер и Маргарита").

Можно запиливать как есть. Но для себя я переписываю в человеческое описание и стройный логичный текст.

Красивая и умная тридцатилетняя женщина без детей. У нее короткие завитые волосы, сделанные в парикмахерской. Ее пальцы тонкие, а ногти острой формы. Брови у нее аккуратно выщипаны в ниточку с помощью пинцета. Она хорошо одета и в ее глазах всегда мерцает загадочный огонек. Ее один глаз немного косит, что придает ей сходство с ведьмой.

Запускаем в нейросеть. Генерация.... Вуаля!

Получилось симпатично и современно. Слишком современно. 
Получилось симпатично и современно. Слишком современно. 

Но виновата ли в современном результате нейросеть? Нет! Потому что она не знает, что мы говорим о даме из романа, действие которого (относящееся к Маргарите) происходит в Москве в 1929 году. И мы можем указать этот контекст. Запускаю новую генерацию со следующим текстом

Красивая и умная тридцатилетняя женщина без детей. У нее короткие завитые волосы, сделанные в парикмахерской. Ее пальцы тонкие, а ногти острой формы. Брови у нее аккуратно выщипаны в ниточку с помощью пинцета. Она хорошо одета по московской моде 20-х годов XX века. В ее глазах всегда мерцает загадочный огонек. Ее один глаз немного косит, что придает ей сходство с ведьмой.

Мне все нравятся, даже не знаю, кто лучше. 
Мне все нравятся, даже не знаю, кто лучше. 

А вот это уже совсем другое дело! Ну, красавица же! Выбирай любую - и будет даже лучше, чем Маргарита из известных экранизаций.

Все дело в деталях и контексте! В деталях и контексте, которые не сможет самостоятельно добавить нейросеть.

К слову, нейросеть не знала, чье описание мы требуем. При этом она обучена огромному количеству информации. Попробую сгенерить портрет этой героини так, чтобы информацию ей пришлось искать самой среди многих и многих источников интернета.

Портрет главной героини романа Михаила Булгакова "Мастер и Маргарита" - Маргариты

Опа! С Москвой уже попрощались! И они уже с Мастером в своей тихой обители! 
Опа! С Москвой уже попрощались! И они уже с Мастером в своей тихой обители! 

Нейросеть сама выбрала, какой ее изобразить и в какой момент действия. Запуталась в деталях, но художник, так видит. В целом, мне кажется годным. Но запрос с конкретным описанием и контекстом мне кажется куда более точным.

Я несколько изменила свой абстрактный запрос

Портрет главной героини романа Михаила Булгакова "Мастер и Маргарита" - Маргариты

Ну, портрет. Ну, красивая. В целом, где-то она могла быть и такой. Например, в тихой обители, где избавилась от парикмахеров и моды двадцатых. Хе-хе. А на балу она, если что, вообще была обнажена, а не в платье.
Ну, портрет. Ну, красивая. В целом, где-то она могла быть и такой. Например, в тихой обители, где избавилась от парикмахеров и моды двадцатых. Хе-хе. А на балу она, если что, вообще была обнажена, а не в платье.

А теперь для сравнения - как видели Марго художники и иллюстраторы.

Симпатично
Симпатично
Марина Влади какая-то
Марина Влади какая-то
А вот в костюме Евы нам не нарисует нейросеть. Этика и запрещенка. 
А вот в костюме Евы нам не нарисует нейросеть. Этика и запрещенка. 

В общем, чем больше информации и контекста, тем более адекватные результаты выдает нейросеть по запросу. Правило железное.

Проверила еще на паре примеров:

Пример 2. Князь Мышкин

Русский аристократ середины 19 века, приехал в Россию из Швейцарии. Молодой человек, тоже лет 26 или 27, роста немного повыше среднего, очень белокур, густоволос, со впалыми щеками и с легонькою, востренькою, почти совершенно белою бородкой.

Мне первый очень нравится, а вам?
Мне первый очень нравится, а вам?

Делаю короткий запрос

Портрет Князя Мышкина из романа Федора Михайловича Достоевского "Идиот"

Хорош, конечно. Портрет парадный. Бороду сбрил.
Хорош, конечно. Портрет парадный. Бороду сбрил.

А вот вариант от реального художника, каким мы привыкли его видеть

Хорошенький. И похож на первый вариант нейросети на мой взгляд
Хорошенький. И похож на первый вариант нейросети на мой взгляд

Пример 3. Гоголевский Плюшкин

Съежившийся худощавый старик с настолько неопрятным внешним видом, что долго нельзя понять, мужчина перед это или женщина. Больше похож на нищего, которому хочется подать милостыню, чем на богатого помещика.

Помнится, я его представляла как-то наподобие первого варианта
Помнится, я его представляла как-то наподобие первого варианта

Короткий запрос:

Портрет героя "Мертвых душ" Плюшкина

Нда))). Общий посыл понятен, но на этом и все. Кроме антуража бы сильно поспорила.
Нда))). Общий посыл понятен, но на этом и все. Кроме антуража бы сильно поспорила.

И снова - вариант художника

Тут, конечно, характера побольше. Но ничего, ИИ и эмоции научится симулировать когда-нибудь
Тут, конечно, характера побольше. Но ничего, ИИ и эмоции научится симулировать когда-нибудь

Посыл, я думаю, понятен: больше деталей, больше контекста, больше оговорок - и нарисует нейросеть все, что угодно. Про стилистику изображений поговорим отдельно. Пока наша задача - научиться давать правильные, понятные, красочные описания словами, чтобы общая суть картинки передавалась.

А теперь домашнее задание: сформулируйте описание литературного героя, киногероя, мультгероя. Сгенерите по описанию изображение. Изменяйте, уточняйте, дополняйте деталями изображение до тех пор, пока оно не станет близко к образу в вашей голове.

А самыми удачными кейсами обязательно делитесь в комментариях! Будем учиться друг у друга!

Всем творческих успехов!

33
11 комментариев

Так забавно, что с нейросетями прямо как с человеком нужно всё расписывать и объяснять запрос. Интересно, как будет совершенствоваться технология и как мы будем описывать "хотелки"

Согласна, забавно. Зато исполнитель она куда более быстрый, нежели люди. И времени потраченного не жалко сразу становится 😂😂. А в будущем - может появится таки считыватель сигнала прямо из мозга, а? Ну пожалуйста 🙏

1

Надо бы как-то нейросеть по сочинениям "русской классике" прогнать, интересно какие выводы заключены будут

Если как с героями "Мёртвых душ" то спасибо-пожалуйста-не надо

Отличная идея) Есть гипотеза, что нейросети, обучаясь на больших языковых моделях, перенимают и культурный код. Так вот у большинства развитых сетей он не наш. А нам нужна, чтобы понимала всю широту русской души. Со всеми сопутствующими😂😂

Все это сказки ...про Емелю, который на печки мечтает...вся .... сеть

Похож на мертвого викинга вокруг которого летают коршуны...