Как Midjourney создаёт запросы для самой себя
Статья немного похожа на «нейросеть показала, как бы выглядели картины известных художников, если бы они были написаны сегодня», но это не так. Мы поразвлекаемся со знаменитыми изображениями, но кроме этого ещё и расскажем о том, как попросить у Миджорни написать запрос для самой себя. Но обо всём по порядку.
Недавно Midjourney запустили интересную фичу: если отправить боту команду "/describe" и загрузить картинку, то он пришлёт в ответе четыре варианта текстового описания для этой картинки. Иными словами, попытается понять по изображению, какими словами её нужно было бы описать для нейросети.
Под картинкой будут стоять кнопки 1-4. Нажав на кнопку, вы отправите на генерацию запрос под этим номером.
Команда "/describe" не тратит минут из тарифа, но, как и сама генерация, сейчас доступна только для платных подписчиков.
Эксперимент напрашивался сам: мы выбрали несколько известных изображений, получили их описание командой "/describe", и отправили это описание обратно в Midjourney на генерацию. Объединять четыре варианта запроса в один финальный нам помогал chatGPT.
Для статьи я перевёл с “алибабанглиша” и немного подчистил финальные запросы, которые нам выдавал бот. Так вы сможете быстрее оценить качество описания, а оригинальный промпт на английском всё равно получите сами, когда отправите боту свои изображения.
В список попали 12 изображений: известные картины, фотографии и, конечно же, мемы. Результаты генерировались тремя моделями — v4, Niji, v5. В конце мы выбирали наиболее близкий или забавный вариант. Погнали.
Статья про модели Midjourney
Крик
Начнём с экспрессии. Родственникам Мунка до сих пор капает несколько крон каждый раз, когда вы ставите кричащий эмоджи 😱
А вот что получилось, когда мы попросили бота описать «Крик»:
Бот смог определить название картины и автора и это увеличило точность генерации. Сначала мы хотели убирать автора, но позже вспомнили, что наша цель — получить точное описание, и бот с этим справился. Так будет не везде.
Дали Атомикус
Кажется, что этот кадр сразу был нарисован нейросетью. И дело не столько в сюрреализме, сколько в том, что Филиппу Халисману понадобилось шесть часов и несколько десятков попыток, чтобы наконец получить нужный результат.
Результат:
Гарольд, скрывающий боль
Фотографии Гарольда (на самом деле его зовут Андраш Арато) использовались в рекламе товаров и услуг для пенсионеров, пока интернет не обратил внимание на боль, которую не могут скрыть его глаза. После того, как Андраша растащили на мемчики, в маркетинг он возвращался лишь однажды: для рекламы вакцины от 237-го штамма коронавируса.
Результат:
Американская готика
Ну раз уж нейросети символизируют очередную техническую революцию, то нельзя оставить это полотно в стороне. По мнению некоторых критиков, лица персонажей картины Гранта Вуда выражают неприязнь к наступающему прогрессу.
Результат:
Лиля Брик
«Ленгиз — книги по всем отраслям знаний!» — для такого рекламного плаката фотограф Александр Родченко сделал снимок музы Маяковского.
Результат:
Марио и Лаура (”Distracted boyfriend”)
Кадр испанского фотографа был выложен на фотосток чтобы принести немного денюшек, а принёс много известности после того, как в 2017 году превратился в мем.
Результат:
Над городом
Одна из любимых картин автора статьи, который прошлым летом внимательно разглядывал нижний левый угол огромного холста Шагала в Новой Третьяковке.
Результат:
Вид из окна в Ле Гра
«Сто фотографий, изменивших мир» (LIFE) начинаются с этого снимка, потому что он считается самой первой фотографией в истории, а создал его изобретатель Жозеф Ньепс в первой половине XIX века.
Результат:
Ъуъ с***
Черный кот на фоне полицейских (фото Кристофера Фёрлонга) стал мемом в 2008 году благодаря пользователю @pinchenic, который непонятно зачем перефотошопил ему лапы.
Результат:
Звёздная ночь
Что будет, если ИИ сойдёт с ума? В случае с Midjourney, я бы не слишком переживал: напишет «Звёздную ночь», а после застрелится, сплагиатив таким образом не только творчество, но и кончину великого художника.
Результат:
Эбби роуд
Альбом должен был называться "Everest", а на обложке битлы должны были взбираться на вершину мира. Но, как известно, «легенды не умирают, легенды обрастают жиром»: посовещавшись, музыканты просто сфотографировались на ближайшей улице, да и с названием альбома решили не заморачиваться.
Результат:
Сеньор Чанг
«Вот столько минут Midjourney остаётся у меня в конце каждой такой статьи». Мемчик из сериала «Сообщество».
Результат:
Заключение
Midjourney отлично знает живопись, но плохо знакома с мемами.
Легко перерисовать своё селфи вряд ли получится. Но если добавить к этому сгенерированному описанию ещё и оригинальную картинку, результаты станут намного к ней ближе.
Функция может быть полезна для того, чтобы воссоздать почерк какого-то художника, обстановку или стилистику фоографии. Некоторые из запросов, которые написал бот, были очень подробными и содержали термины, о которых я услышал впервые (и на русском, и на английском). Очень рекомендую попробовать посмешивать стили разных картин или превратить любимый мем в крутой арт.
А лучшее обучение — это практика, поэтому каждый день мы тренируемся на котиках. Смотреть на это можно в нашем кошачьем канале. Всем добра и валерьяны за наш счёт!