Урок 1: Рисуем с помощью нейросети. Практика
Надеюсь, вы уже пощупали функционал генерации картинок нейросетью самостоятельно и создали свои первые нейрокартины.
Если нет - ничего страшного. Простейший кейс, не требующий усилий со стороны вашей фантазии, но позволяющий быстро ознакомиться с возможностями нейросетей по созданию (генерации) картинок я привела, заставив нейросеть Midjourney иллюстрировать русские крылатые фразы.
Посмотреть можно здесь:
Но стоять на месте мы не собираемся, а потому двигаемся дальше. Углубляем и закрепляем навык.
Абстрактные запросы нейросети на генерацию картинок работают также, как и в случае с абстрактной постановкой задачи живому художнику или дизайнеру. Да-да, без внятного ТЗ результат ХЗ.
В человеческой среде мне не раз приходилось объяснять руководителям и собственников бизнеса, что нельзя требовать от сотрудников результата без торжественного вручения инструментов, алгоритмов и проведения обучения.
Хотите, чтобы Иван Иванов выкопал сегодня картошку? Тогда дайте ему лопату, ведро и ящики, отмерьте участок работы на огороде, разберите, как выглядит картофельный стебель, научите отличать его от лебеды и крапивы, разъясните, как подкапывать картофельный стебель, чтобы не повредить клубни, как разрывать землю руками, чтобы собрать урожай полностью, как отличить хорошие клубни от гнилых, покажите, как складывать в ведро и пересыпать в ящик, чтобы картошка не повредилась и была пригодна для долгого хранения. Уточните, к какому времени работа должна быть закончена и опишите, где и в каком виде должен к этому времени быть размещен собранный урожай.
С нейросетями так же. Множество людей попробовали использовать инструменты нейросетей, но после нескольких попыток получили неожиданный результат и бросили это дело.
"Тупая эта ваша хваленая нейросеть!" - сказали они и ушли в закат делать рутинные задачи руками, по старинке, убивая уйму времени и сил.
Что могу сказать?
"Тупые" нейросети, выстроенные на математических алгоритмах, с фантастической для человека скоростью обучаются. Так, что несмотря на свою техническую природу уже понимают человеческий язык общения, а не только нолики, единички, программерские абракадабры и прочие коды.
Да, нейросети пока не волшебники, а только учатся. И все еще не экстрасенсы, а значит не знают, какую картину результата нарисовали у себя в голове, до тех пор, пока вы не разложите все по полочкам. А значит, если результат обработки запроса выходит далеким-далеким от ожидаемого, проблема не в нейросети, а в сигнале, команде, которую дает ей homo sapiens, сидящий по ту сторону экрана.
Поэтому, хотя нейросети и человек обладают разными навыками и способностями (мы рассмотрим эти отличия в следующем уроке), я рекомендую всем гуманитариям очеловечивать нейросеть во время работы с ней, да простят меня любимые мной технари.
Да-да. Общайтесь с нейросетью, как с любимым ребенком, учеником, студентом, другом, который вообще не компетентен в предлагаемой области знаний, бабушкой, которой объясняете, как пользоваться смартфоном, младшим коллегой, чьим наставником являетесь, - как с любым человеком, от которого хотите получить предсказуемый результат вследствие выполнения определенного действия. По большому счету, ей-то все равно, как вы к ней относитесь...Но как только вы представите себе, что объясняете задание живому, который вообще не в теме, сможете сможете сформировать запрос куда эффективнее - так уж работает человеческая психика.
Пора попробовать. Итак, нам нужна картинка по точному описанию. Что бы это могло быть? Предлагаю пока отложить фантазию и дать нейросети уже существующие описания.
А не обратиться ли нам к героям классической литературы?
Пример 1. Булгаковская Маргарита
Что имеем у автора?
..Бездетная тридцатилетняя Маргарита.. красива и умна.....короткие завитые волосы...парикмахерская завивка...тонкие с остро отточенными ногтями пальцы..ощипанные по краям в ниточку пинцетом брови.. на хорошо одетую женщину...женщине, в глазах которой всегда горел какой‑то непонятный огонечек...косящей на один глаз ведьме..(цитаты из романа М.Булгакова "Мастер и Маргарита").
Можно запиливать как есть. Но для себя я переписываю в человеческое описание и стройный логичный текст.
Красивая и умная тридцатилетняя женщина без детей. У нее короткие завитые волосы, сделанные в парикмахерской. Ее пальцы тонкие, а ногти острой формы. Брови у нее аккуратно выщипаны в ниточку с помощью пинцета. Она хорошо одета и в ее глазах всегда мерцает загадочный огонек. Ее один глаз немного косит, что придает ей сходство с ведьмой.
Запускаем в нейросеть. Генерация.... Вуаля!
Но виновата ли в современном результате нейросеть? Нет! Потому что она не знает, что мы говорим о даме из романа, действие которого (относящееся к Маргарите) происходит в Москве в 1929 году. И мы можем указать этот контекст. Запускаю новую генерацию со следующим текстом
Красивая и умная тридцатилетняя женщина без детей. У нее короткие завитые волосы, сделанные в парикмахерской. Ее пальцы тонкие, а ногти острой формы. Брови у нее аккуратно выщипаны в ниточку с помощью пинцета. Она хорошо одета по московской моде 20-х годов XX века. В ее глазах всегда мерцает загадочный огонек. Ее один глаз немного косит, что придает ей сходство с ведьмой.
А вот это уже совсем другое дело! Ну, красавица же! Выбирай любую - и будет даже лучше, чем Маргарита из известных экранизаций.
Все дело в деталях и контексте! В деталях и контексте, которые не сможет самостоятельно добавить нейросеть.
К слову, нейросеть не знала, чье описание мы требуем. При этом она обучена огромному количеству информации. Попробую сгенерить портрет этой героини так, чтобы информацию ей пришлось искать самой среди многих и многих источников интернета.
Портрет главной героини романа Михаила Булгакова "Мастер и Маргарита" - Маргариты
Нейросеть сама выбрала, какой ее изобразить и в какой момент действия. Запуталась в деталях, но художник, так видит. В целом, мне кажется годным. Но запрос с конкретным описанием и контекстом мне кажется куда более точным.
Я несколько изменила свой абстрактный запрос
Портрет главной героини романа Михаила Булгакова "Мастер и Маргарита" - Маргариты
А теперь для сравнения - как видели Марго художники и иллюстраторы.
В общем, чем больше информации и контекста, тем более адекватные результаты выдает нейросеть по запросу. Правило железное.
Проверила еще на паре примеров:
Пример 2. Князь Мышкин
Русский аристократ середины 19 века, приехал в Россию из Швейцарии. Молодой человек, тоже лет 26 или 27, роста немного повыше среднего, очень белокур, густоволос, со впалыми щеками и с легонькою, востренькою, почти совершенно белою бородкой.
Делаю короткий запрос
Портрет Князя Мышкина из романа Федора Михайловича Достоевского "Идиот"
А вот вариант от реального художника, каким мы привыкли его видеть
Пример 3. Гоголевский Плюшкин
Съежившийся худощавый старик с настолько неопрятным внешним видом, что долго нельзя понять, мужчина перед это или женщина. Больше похож на нищего, которому хочется подать милостыню, чем на богатого помещика.
Короткий запрос:
Портрет героя "Мертвых душ" Плюшкина
И снова - вариант художника
Посыл, я думаю, понятен: больше деталей, больше контекста, больше оговорок - и нарисует нейросеть все, что угодно. Про стилистику изображений поговорим отдельно. Пока наша задача - научиться давать правильные, понятные, красочные описания словами, чтобы общая суть картинки передавалась.
А теперь домашнее задание: сформулируйте описание литературного героя, киногероя, мультгероя. Сгенерите по описанию изображение. Изменяйте, уточняйте, дополняйте деталями изображение до тех пор, пока оно не станет близко к образу в вашей голове.
А самыми удачными кейсами обязательно делитесь в комментариях! Будем учиться друг у друга!
Всем творческих успехов!
Так забавно, что с нейросетями прямо как с человеком нужно всё расписывать и объяснять запрос. Интересно, как будет совершенствоваться технология и как мы будем описывать "хотелки"
Согласна, забавно. Зато исполнитель она куда более быстрый, нежели люди. И времени потраченного не жалко сразу становится 😂😂. А в будущем - может появится таки считыватель сигнала прямо из мозга, а? Ну пожалуйста 🙏
Надо бы как-то нейросеть по сочинениям "русской классике" прогнать, интересно какие выводы заключены будут
Если как с героями "Мёртвых душ" то спасибо-пожалуйста-не надо
Отличная идея) Есть гипотеза, что нейросети, обучаясь на больших языковых моделях, перенимают и культурный код. Так вот у большинства развитых сетей он не наш. А нам нужна, чтобы понимала всю широту русской души. Со всеми сопутствующими😂😂
Все это сказки ...про Емелю, который на печки мечтает...вся .... сеть
Похож на мертвого викинга вокруг которого летают коршуны...