Гайд по нейросетям для тех, кто как раз собирался попробовать

Статья рассчитана на нулевой уровень погружения в сферу, но наполнена кучей полезностей, примеров и личного опыта. Ни один из упомянутых сервисов я не рекламирую. Если вы продвинутый пользователь, то, вероятно, не найдете тут откровений. С предложениями, благодарностями и проклятиями приглашаю вас в мой телеграм. Все примеры сгенерированы мной. Удачи!

Содержание:

Работа с текстовой информацией
Сценарии использования
Структура запроса для ChatGPT
Работа с изображениями
Структура запроса для Midjourney

Нейросеть — один из видов машинного обучения. В этом документе я буду называть так ChatGPT, YandexGPT, генераторы картинок вроде Stable Diffusion и Midjourney и все такое прочее. Нейросетей, кстати, довольно много.

LLM (Large Language Model) – Один из самых распространенных видов нейросетей в данный момент. Хотя не единственный. К нему относятся ChatGPT, LLaMa, Claude, YandexGPT и другие. Отличается тем, что способен к самообразованию и учится на основе неразмеченных массивов текста.

Промпт — запрос-обращение к нейросети. Может включать в себя не только человеческий язык, но и технические параметры, такие как --s 1000 или --w 750.

Галлюцинация — сбой нейросети, когда она рисует на руке человека шесть пальцев или придумывает противоречащие реальности факты. Мощные модели вроде ChatGPT галлюцинируют реже. Слабые — чаще. Но в любом случае стоит держать в голове вероятность ошибки.

Лирика

Повсеместно доступные и применимые на практике нейросети — один из главных технологических скачков нашего времени. Как и любое значимое изменение в нашем окружении, это событие безжалостно поделит людей на инертных и адаптировавшихся. Здесь можно копнуть в теорию эволюции, но самый близкий пример, который хочется привести, это распространение компьютеров. Еще недавно в вакансиях писали про «уверенное владение ПК». Уверен, что было много людей, которые относились к Экселю со скепсисом, настаивая что деревянные счеты (или чем пользовались до Экселя? Зерном?) надежнее.

Сегодня умение пользоваться компьютером настолько базовый навык, что никто не тратит время на его проверку, а его отсутствие вызывает недоумение.
Что-то похожее, по моему глубокому убеждению, ждет и нейросети.

Главная проблема

Самые значительные технологические прорывы почти всегда являются еще и сменой парадигмы. Переход от отвертки к шуруповерту ускорил процессы, но не повлиял на саму идею строительства. Переход к нейросетям, с другой стороны, заставляет пересмотреть наши взгляды на то, чем мы должны заниматься.

В этом главное препятствие для эффективного их использования. Люди, которые не готовы поменять привычные для себя процессы и отдать часть работы ИИ, закономерно не видят в нейросетях большого смысла.

Если же вы свыкнетесь с дискомфортной мыслью, что многие вещи, которые вы считали своей работой, нейросети делают эффективнее вас — вы получите лучшего личного помощника, которого видел свет.

Теперь мы можем концентрироваться на смысле того, что мы делаем.

В этом исследовании ученые опять пришли к выводу, что есть два типа людей. Во всяком случае, когда дело касается нейросетей. Киборги и кентавры. Первые постоянно взаимодействуют с чат-ботом, проверяя и поправляя его результаты. Вторые отдают ИИ задачи, которые он точно выполнит хорошо, а остальное делают сами. В примерах ниже используются оба подхода.

Языковой барьер

Большинство доступных нам нейросетей понимает русский. Некоторые, как YandexGPT, только его и понимают. Я сам составлял примеры на русском, чтобы статью было легче читать. Однако, за исключением YandexGPT, составление промпта на английском языке почти всегда дает лучший результат. Это связано с тем, что массив данных, на котором учатся нейросети, преимущественно англоязычный. Если на выходе вам нужен текст на русском языке, то лучше попросить нейросеть перевести ответ.

Кстати, о создании своей большой LLM заявляли и в Тинькофф. При всем оптимизме, идея своей универсальной нейросети вызывает скепсис. Нейросетям нужна еда в виде данных, а данных на русском языке, вероятно, всегда будет меньше, чем на английском.

Зато созданию небольших и узкоспециализированных систем ничего не мешает.

Если перспектива написания текста на английском вызывает у вас чувство тревоги в районе живота, вам поможет нейронный переводчик DeepL. Он работает кратно лучше, чем Google Translate и Reverso. А еще дает возможность на лету перефразировать все предложение, если интонация кажется вам неудачной. Бесплатный, кстати. Нравится.

Поисковик

В отдельных вопросах ChatGPT не просто сравним с поисковиками, а заметно их превосходит. Как определить, в каких именно? Принцип простой.

Нужен конкретный факт, число, дата, сумма, имя? Идите в Google или Яндекс. Нужна информация, которая включает в себя аналитику или коллективный опыт? Нейросеть вас избавит от путешествий по поисковой выдаче и сбора информации по крупицам в детективном стиле.

Спросите ChatGPT про лучшие рецепты пирожков. Или о том, как начать медитировать. Или о чем-то таком:

Промпт: Расскажи в пяти предложениях, с чего лучше начать изучать фронтенд разработку, если уже знаешь основы HTML и CSS?

Ответ: Для продолжения изучения фронтенд разработки после основ HTML и CSS, следует изучить JavaScript для добавления интерактивности веб-страницам, включая манипуляцию DOM и изучение современных функций языка. После освоения JS приступите к изучению библиотеки React, Vue. js или Angular для создания более сложных приложений. Необходимо также научиться использовать сборщики проектов (например, Webpack) и систему контроля версий (Git). Практика важна: создавайте небольшие проекты, чтобы укрепить свои знания и навыки. Не забывайте об отладке и тестировании кода с помощью различных инструментов и фреймворков.

Есть поисковик, похожий интерфейсом на привычные Гуглы и Яндексы, но работающий на базе ChatGPT – Perplexity. Я с ним не сжился, но кому-то нравится. Может и вам подойдет.

Копирайтер и редактор

Не советую использовать результат работы нейросети в важных публикациях. Законом не запрещено (пока? уже?), но страшно. К тому же, наметанный глаз способен отличить текст из нейросети от работы органического автора.

Оптимальным вариантом использования мне видится создание и постепенное уточнение текста с нейросетью, а в конце — ручная шлифовка и добавление важных деталей.

Промпт: Представь что ты бэкенд разработчик, с большим опытом в создании приложений. Напиши текст публикации про Kubernetes. Расскажи в четырех предложениях о том, что это за технология, как появилась, почему важна и как используется. Аудитория публикации — люди, которые заказывают разработку, но не разбираются в ней. Избегай сложных терминов.

Уточнение: Упрости текст и отредактируй в соответствии с принципами инфостиля. Добавь примеры известных приложений, которые используют Kubernetes.

Ответ: Kubernetes – это как дирижер оркестра для компьютерных приложений. Он помогает автоматически организовывать работу приложений, чтобы они могли эффективно обслуживать много пользователей, без перебоев и перегрузок. Появился он благодаря умным людям из Google, которые хотели сделать работу с сетью проще и быстрее. Популярные приложения, такие как Pinterest, Airbnb и Spotify, используют Kubernetes, чтобы их сайты работали гладко даже во время больших распродаж или когда миллионы людей одновременно слушают музыку.

В бесплатный сервис ChatPDF можно загрузить PDF-кто бы мог подумать-файл редполитики. Он проанализирует содержимое документа и сможет консультировать вас или ваших сотрудников на его основе. Удобно!

Продуктовый менеджер

Чтобы создать и развивать продукт, вам нужно знание. Часть знаний продуктовый менеджер аккумулирует в виде опыта, часть добывает эмпирическим способом, а часть — через исследования. Из всех опций, перечисленных выше, пользоваться исследованием запарнее всего. Капитализм просит ускориться и нейросеть приходит на помощь. Начнем с подготовки к интервью:

Промпт: Действуй как опытный менеджер продукта и специалист в Lean Startup, Jobs to Be Done и Product Discovery. Создай список из 6 вопросов, которые я могу задать потенциальным пользователям и клиентам на discovery-интервью по моему продукту Easy Check, который позволяет проводить производственные инспекции на смартфоне и собирает статистические данные проверок.

Ответ: Применяя принципы Lean Startup, Jobs to Be Done и Product Discovery, важно задавать вопросы, которые помогут вам понять настоящие потребности потенциальных клиентов и как ваш продукт может помочь им достичь их целей. Вот список вопросов, которые вы можете задать на интервью:

Об инспекционной рутине: Какие типы производственных инспекций вы обычно выполняете в рамках вашей текущей работы?
Инструменты и процессы: Какие инструменты и процессы вы сейчас используете для проведения инспекций и сбора данных? В чем вы видите их главные ограничения?
Опыт использования: Какие задачи являются наиболее утомительными или времязатратными при проведении инспекций с использованием текущих методов?
Проблематика сбора данных: Сталкивались ли вы с трудностями при сборе и анализе данных после производственных инспекций? Можете рассказать об этих случаях?
Jobs to Be Done (Задачи к выполнению): Когда вы последний раз испытывали разочарование в результате инспекционной работы? Что вызвало это разочарование?
Расчет эффективности: Как бы вы оценили стоимость времени, затраченного на производственные инспекции и последующую обработку данных?

Можно пойти дальше! Запишите интервью в аудиоформате и закиньте в бесплатное приложение MacWhisper. Нейросети переведут аудио в текст. Расшифровку можно положить в СhatGPT и попросить его добыть оттуда задачи пользователей, очистить текст или выделить сегменты аудитории.

Разработчик

Если вы пишете код, то, скорее всего, давно уже пользуетесь нейросетями и сами все знаете. Но если вы дизайнер, редактор или просто находитесь неподалеку — написание кода с нейросетью может стать для вас открытием и подспорьем. Для меня стало. Теперь, верстая сайт, я могу не дергать знакомых фронтенд-разработчиков по мелочам. И скрипты пишу.

Промпт: Напиши код на JavaScript, который позволит пользователю скопировать в буфер обмена ссылку «dsgners. ru» при нажатии на элемент с классом. сopy

Ответ: Чтобы реализовать такую функциональность, мы создадим обработчик событий для клика по элементу с классом. copy, который будет устанавливать текст ссылки в буфер обмена. Используем navigator. clipboard. writeText() для копирования текста. Ниже приведён пример кода:

!-- HTML элемент для отображения ссылки и копирования --> <div class="copy">Кликните, чтобы скопировать ссылку на dsgners.ru</div> <script> // Проверяем, есть ли поддержка clipboard в браузере if (!navigator.clipboard) { console.error('Копирование в буфер обмена не поддерживается вашим браузером'); } else { // Находим элемент по классу .copy и добавляем обработчик события клика const copyElement = document.querySelector('.copy');copyElement.addEventListener('click', () => { // Текст, который хотим скопировать const urlToCopy = 'dsgners.ru'; // Используем API буфера обмена для копирования текста navigator.clipboard.writeText(urlToCopy).then(() => { console.log('Ссылка скопирована в буфер обмена'); // Тут можно добавить какое-нибудь визуальное подтверждение для пользователя // Например, мигание текста или сообщение об успешном копировании }).catch(err => { console.error('Произошла ошибка при копировании: ', err); }); }); } </script>

ChatGPT приемлемо справляется с мелкими задачами. Но если вы хотите круче, надежнее и прямо в IDE — есть Github Copilot. Вместо генерации ответа на вопрос, он предугадывает код, который вы пишете. В момент, когда вы его пишете. Разработчики прыгают от радости.

Психолог

Нейросети в курсе большинства популярных направлений психотерапии и способны подтолкнуть к новым мыслям. Это не терапия и не замена специалисту-человеку, но неглупый взгляд со стороны, который может быть полезным. Возможно, это связано с тем, что составление промпта вынуждает нас самих сформулировать волнующую проблему, а это, как я слышал, уже важный шаг.

Особо не верьте мне в этом абзаце. Я еще меньший психолог, чем нейросеть.

Промпт: В роли опытного психолога, практикующего гештальт-терапию, помоги мне перестать бояться выйти в публичное поле со своим стартапом. Мне приятно его разрабатывать, но я стесняюсь рассказывать о нем людям. Меня это беспокоит и мне кажется, что я мешаю своей собственной карьере. Используй не больше пяти предложений и дай совет.

Ответ: Как гештальт-терапевт, я хотел бы помочь вам осознать свои переживания и чувства стыда в моменты, когда вы собираетесь говорить о своем стартапе. Допустите и примите эти чувства как естественную часть процесса, поднимая их в осознанность, чтобы они не управляли вами подсознательно. Затем сосредоточьтесь на том увлечении и страсти, которые вызывает ваш проект, и подумайте, как из-за невысказанных вами идей и ценностей общество теряет больше, чем вы от испытываемого страха. Попрактикуйтесь в безопасной обстановке с другом или в группе поддержки, чтобы привыкнуть делиться информацией о вашем проекте и укреплять уверенность в себе. И последнее, помните, что каждый раз, когда вы выходите из зоны комфорта, вы растете как профессионал и как личность, и это путешествие ценно само по себе.

В своем телеграм-канале кто-то рассказывал, как скармливает ChatGPT содержимое дневника, чтобы выявить тенденции и повторяющиеся сценарии. А уже с этой информацией идет к терапевту. Я так не пробовал, но звучит интересно.

Личный ассистент

Нужно написать за вас письмо? Выжать водяной имейл как тряпку? Составить диету для кота? Придумать структуру презентации? Накидать идей для подарка жене? Нейросетевой ассистент справится. Или хотя бы постарается.

Промпт: Сегодня вечером у нас с женой будет романтический ужин. Придумай три идеи блюда для двоих, которые я успею приготовить за три часа. Они должны подходить к красному вину, быть несложными в приготовлении и не требовать наличия духовки. Каждое из трех блюд опиши в одном предложении и посоветуй, чем его можно дополнить.

Ответ: Теплый салат из свеклы с козьим сыром, дроблеными грецкими орехами и свежей рукколой — дополните его медово-горчичным дрессингом для неповторимого вкуса. Стейк из тунца на гриле подают с заправленной лимонным соком и оливковым маслом зеленью и свежими помидорами черри, что добавит блюду освежающей летней нотки. Паста с чесночным маслом, петрушкой и пармезаном — украсьте её сверху тертым черным трюфелем или дольками обжаренных в чесноке креветок для более изысканного вкуса. Каждое из этих блюд сочетается с красным вином, готовится относительно быстро и не требует использования духовки.

В английском языке есть смешная аббревиатура TL; DR. Она переводится как «слишком много, не стал читать». Почти как «не читал, но осуждаю». ChatGPT ее понимает и, если прислать ее вместе с текстом, он сделает из текста выжимку. Используйте трюк на этой статье, если уже тяжело.

ChatGPT — самый надежный выбор. YandexGPT слабая, обильно галлюцинирует и не говорит по английски, но в несложных задачах может справиться. Альтернативы вроде Claude оставим гикам. Мы с вами суровые практики в рамках этой статьи.

Официальный сайт ChatGPT

Нужно зарегистрироваться с VPN и оплатить (если хотите платную версию) с зарубежной карты. После регистрации включать VPN каждый раз не нужно. Можно пользоваться бесплатно. Самый классный вариант.

Бот в телеграме

Боты чаще всего развод для не-мамонтов, но этот приемлемый. Можно пользоваться бесплатно. Компромиссный вариант, если лень ходить по ссылкам.

Недавно Microsoft выпустили бесплатное приложение Copilot со встроенным актуальным ChatGPT и DALL-E. Пока что без ограничений, но они будут. Доступно в App Store и Google Play Market.

Промпт для ChatGPT не делится на строгие блоки и может быть описан в совершенно свободной форме. Однако, есть смысловые составляющие, которые нужны регулярно:

Роль

Хороший способ заставить нейросеть стать конкретнее или использовать отдельную область знаний для ответа на ваш вопрос. Предложите ей занять роль эксперта, который вам нужен прямо сейчас.

Промпт: Ты — опытный разработчик на JavaScript. Объясни мне, что такое функция. Используй одно предложение.

Ответ: В JavaScript функция – это блок кода, предназначенный для выполнения определенной задачи, который может быть вызван по имени многократно с разными параметрами и может возвращать значение.

Промпт: Ты — философ. Объясни мне, что такое функция. Используй одно предложение.

Ответ: Функция в философии — это роль или упорядоченная деятельность, которую сущность выполняет в рамках некоей системы или структуры, придавая смысл своему существованию и способствуя целостности или цели данной системы.

Контекст

Пробуя работать с нейросетью, я понял, как наша коммуникация бедна и зависима от контекста.

Нейросеть — инопланетянин. В отличие от прозорливых коллег, она по умолчанию ничего не знает о вашей работе, вкусах и о том, как вы провели вчерашний вечер.

Без этих знаний она часто ошибается в вещах, которые кажутся очевидными: отвечает слишком развернуто или слишком сжато, выдает слишком банальные результаты. Чтобы этого избежать, дайте ей больше узнать о задаче.

Смотрите, какой насыщенный ответ дает ChatGPT, вооруженный информацией о контексте:

Промпт: Я делаю сайт для продажи услуг по разработке чат-ботов. Моя аудитория — средний и крупный бизнес, занимающийся логистикой, нефтедобычей, тяжелой промышленностью. Напиши для моего сайта три предложения о том, чем чат-боты могут быть полезны моей аудитории. Особенно важно показать их потенциал в области обеспечения производственной безопасности.

Ответ: Наши чат-боты повысят эффективность вашей логистической операции, обеспечивая автоматизированный процесс отслеживания грузов, расписаний и своевременной передачи важных уведомлений.

Разработка чат-ботов с функциями обработки статистических данных позволит оптимизировать ваши производственные процессы, предоставляя мгновенный доступ к ключевым метрикам и обеспечивая быструю реакцию на изменения в производственной среде.

Наша технология способна обеспечить непрерывный мониторинг и своевременное уведомление о потенциальных опасностях и чрезвычайных ситуациях для обеспечения безопасности в производственных предприятиях в реальном времени.

Форма результата

Покажите, каким должен быть формат идеального ответа. Это может быть буквальное сходство с манерой письма известного автора. А может быть просто перечисление необходимых составляющих или структуры ответа.

Промпт: Ты — опытный маркетолог, который специализируется на рекламных кампаниях для больших брендов. Придумай рекламный баннер для сервиса Хладсклад, который позволяет арендовать промышленные холодильные контейнеры. Идея баннера должна включать заголовок, одно предложение текста, список из трех причин воспользоваться услугами сервиса и текст для кнопки.

Ответ:

Заголовок: "Свежесть Вашей продукции — наша забота!"

Текст: "Хладсклад — надежное решение для хранения на любой срок."

Три причины воспользоваться услугами:

Гибкий тариф: аренда от 1 дня до нескольких месяцев.
Современные холодильные контейнеры: плюсовая и минусовая температура.
Безопасность: круглосуточное видеонаблюдение и контроль доступа.

Текст для кнопки: «Арендовать сейчас»

Ограничения

Как и человеку с его органическим творчеством, нейросети нужны рамки чтобы выдать хороший продукт. Самые часто используемые ограничения — по размеру, конкретным словам и по стилю — позволяют гибко настраивать результат и тратить кратно меньше времени на его полировку. Почти реверсивная психология.

Промпт: Напиши деловое письмо моему коллеге Марку Аврелию. В письме должно быть рассказано о том, что я не успеваю на сегодняшнюю встречу в Zoom, потому что моя кошка съела компьютерную мышь и я с ней еду к ветеринару. Не используй больше 4 предложений. Не используй вежливые слова и обращения. Не используй слово кошка.

Ответ: Марк! Отменяю сегодняшнюю встречу в Zoom. Моя мышь сломана, еду к ветеринару. Перенесем на завтра. Согласуй время. Лева.

Уточнение

Иногда нейросеть ощущается как волшебная палочка (вжух), но это не так. Не всегда так. Неудачный результат может быть связан со слабостями конкретной нейросети, но чаще — с некорректным или неточным промптом.

Не настраивайте себя на мгновенный вау-эффект и не печальтесь, если ответ вас не устроил. Уточняйте промпт постепенно.

Некоторые нейросети, включая ChatGPT, понимают взаимосвязь последовательных запросов и могут продолжать диалог без переписывания первого промпта.

Промпт: Действуй как специалист по брендингу в небольшой и креативной студии. Придумай пять вариантов названия для цифрового продукта, который позволяет автоматизировать создание впечатляющего дизайна. Названия должны быть на английском языке.

Ответ: DesignForge, CreatiMatic, DigiVision, AestheticPro, BrandSimply

Уточнение: Предложи еще варианты. Все названия должны быть не длиннее 6 букв и не должны содержать в себе слова «design«, »creative».

Ответ: QuickArt, ImageX, Brandr, Desyne, Visage

Есть несколько неочевидных способов повысить качество ответов. Например, вы можете по шагам описать то, как должен думать ChatGPT. Еще можно попросить нейросеть проверять собственные ответы — это контринтуитивно, но реально улучшает результат. Еще можно пообещать награду. Глубокий разбор того, как и почему определенные слова влияют на ответ можно прочитать в руководстве по промпт-инжинирингу. На русском.

Фотография и стоки

С точки зрения ресурсов и управления, изображения, созданные в нейросети, находятся где-то между стоковыми фотографими и настоящим фотосетом. Больше контроля над картинкой, чем на стоках, но меньше чем с кожаным специалистом. Больше затраченного времени, чем на скачивание фото, но меньше, чем на организацию съемки. Вы поняли.

Исходя из этого предполагаю, что ни стоки, ни фотографы не исчезнут. Но если для вас фотобанки были слишком одноразовыми, а фотографы слишком дорогими — добро пожаловать в нейросети.

1: Extreme close-up shot of blue-eyed nordic woman in front of infinite azure sky. Her blonde hair fluttering in the wind. She wearing vibrant but minimal gucci sweater. Shot on Fujifilm, Kodak film 200, arthouse

2: Low angle and extreme wide shot of a a white high-speed train, speeding down a huge railway arched stone bridge over the valley. Surrounded by a overgrown alpine forest during sunny summer midday. In the background are mountains peaking into the clouds. Arthouse, hyperrealistic, 8k

3: Wide side angle shot of a two men and one woman next to each other on a business meeting, displaying a range of emotions including engagement and happiness. People dressed in casual and elegant clothes. They sitting at the light wood table. On the table are coffee cups, sticky notes, pens and a lot of papers. One of them shows something on a apple laptop. They in a clean sunny crowded loft office, with a lot of plants, and white walls. The image conveys a strong grainy texture and documents the happiness from the creative cooperative work

Одна из чудесных особенностей нейросетей в том, что они позволяют генерировать много изображений в одной стилистике. Это позволяет использовать их как один из атрибутов вашего бренда. Например, так теперь делает Restore. А на сайте Neurascapes вы найдете несколько красивейших наборов сгенерированных изображений. Промпты там тоже указаны, можно забирать.

Иллюстрации

Возможность оживить небольшие дизайн-объекты, для которых дорого звать дизайнера или художника. Из самого простого — фоны для презентаций, иллюстрации, заставки и прочий задний план. У нейросетей плоховато с конкретикой, поэтому лучше всего нейронные иллюстрации работают, когда вам нужно не продемонстрировать конкретный объект или символ, а создать общее впечатление.

1: 3d-render of a small village against gradient background, in the style of pure color, soft light, pastel palette, zeiss planar t* 80mm f/2.8, realistic detailing

2: Orange and red, background with blue and black, in the style of wavy lines, light black and pink, 8k resolution, x-ray film, hyperbolic expression, matte photo, luminous shadowing

3: Simple flat vector illustration of a factory worker holding phone at his hand, isolated on a white background --s 700

Советую сразу идти в Midjourney или DALL-E, не заглядывая в сторону российских аналогов, вроде Кандинского и Шедеврума. Российские сервисы могут быть немного проще в освоении, но, к сожалению, неконкурентоспособны. Также осознанно оставляю за скобками инструменты вроде SD, потому что нужно попыхтеть, чтобы заставить их хорошо работать. Сам предпочитаю Midjourney, поэтому дальше будет о ней.

А все таки! Можно ли получить хороший результат от Шедеврума или Кандинского? Ну, наверное да. Я не хейтер.

Чтобы сравнить их с Midjourney, предлагаю посмотреть, что по одинаковому промпту tired man in blue vintage workwear and a blue construction helmet lying in the grass in the european grassland. arthouse, 8k, depth of field выдают Кандинский и Midjourney:

Midjourney справа.

По умолчанию все нейросети отдают изображения в небольшом разрешении, около 1024 х 1024. Этого впритык хватает на публикацию в соцсетях, но маловато для других задач. Используйте бесплатный нейронный апскейлер Upscayl, чтобы увеличить изображение. Или платный (но очень хороший) Magnific AI.

Midjourney

Discord

С него все началось. Discord — дальний западный родственник Телеграма, с серверами вместо каналов и акцентом на звонки. Еще там есть боты, а в боте Midjourney. Придется привыкать. И платить с зарубежной карты.

Бот в телеграме

Тот же бот, что и для ChatGPT. Медленней, чем Discord, и нельзя настроить формат изображения. Но если вам только спросить — пойдет.

Промпт для Midjourney включает в себя префикс, сцену, суффикс и параметры. Можно, в принципе, не обращать на них внимания и составлять запрос как того требует душа и гороскоп. Но с ними получится лучше и управляемее, поэтому давайте разберемся.

Префикс

Здесь определяются основные характеристики изображения. Хотите акварельный рисунок? Цифровой арт? Крупный план? Широкоугольный объектив? Аниме? 3D-рендер? Укажите это в начале вашего промпта, например: medium full shot, 3d-render, oil painting, 8-bit pixel art, side angle shot. Можете сочетать. А можете не указывать ничего. По умолчанию Midjourney будет думать, что вы хотите фотографию.

Вот как будет меняться стиль изображения, в зависимости от заданного нами префикса (остальная часть промпта неизменна):

1: Medium full shot of a woman under the snow looking at the camera. She have snowflakes on her face, black hair and big eyes. She is wearing a coat and surrounded by a urban environment during evening. A film still directed by Wes Anderson, cinematic, arthouse

2: Digital art of a woman under the snow looking at the camera. She have snowflakes on her face, black hair and big eyes. She is wearing a coat and surrounded by a urban environment during evening. A film still directed by Wes Anderson, cinematic, arthouse

3: 8-bit pixel art of a woman under the snow looking at the camera. She have snowflakes on her face, black hair and big eyes. She is wearing a coat and surrounded by a urban environment during evening. A film still directed by Wes Anderson, cinematic, arthouse

Запоминать все виды ракурсов и форматов необязательно. В видео 30 Types of Shots автор показывает, чем отличаются point of view, extreme wide, close up и многие другие. Есть еще вот такая статья. На ту же тему.

Сцена

Это основная часть промпта. В ней, в свободной форме, описывается конечный результат. Что за объект вы хотите изобразить? Как он выглядит? Из чего сделан? Что с ним происходит? Что его окружает? Отличительные черты?

Не стесняйтесь использовать оценочные суждения вроде beautiful, messy, fairy, grim, elegant и много прилагательных. Похожий по косвенным признакам сюжет может выглядеть совершенно по разному и создавать разное ощущение:

1: Wide shot of a offroad tipper truck painted in white and blue, speeding down a snowy winter road. Surrounded by beautiful fairy winter forest during sunny morning. A film still directed by Denis Villeneuve, cinematic, 8k

2: Wide shot of a offroad tipper truck painted in white and blue, speeding down a narrow snowy winter road. Surrounded by foggy winter spruce shadow casting forest during sunny morning. A film still directed by Denis Villeneuve, cinematic, 8k

3: Wide shot of a offroad tipper truck painted in white and blue, crawling through a messy, dirty road. Surrounded by a few people in dark winter spruce forest during midday. A film still directed by Denis Villeneuve, cinematic, 8k

Суффикс

Суффиксом называют часть промпта, в которой дается информация об изображении целиком, а не об объекте и сюжете.

Картинка должна быть в определенной палитре? Тогда можно поиграть со словами bichromatic, monochromatic, complementary colors. Более детализированной? Напишите что-то в духе: 8k, high-resolution, intricate details. Это не увеличит фактическое разрешение изображения, но сделает его более резким и насыщенным деталями.

Нужно изображение в стиле известного режиссера или художника? Используйте его имя, как в примерах ниже. Можно указать даже камеру, объектив и пленку, которые Midjourney должна симулировать.

1: A side angle shot of a smiling elegant woman with a cup of coffee sitting at the wooden table in a sunny crowded cafe. She is wearing a gucci turtle neck. Shadows casting through the windows. Captured in style of Xavier Dolan, with a film camera, Fujifilm, and Kodak rolls, the image conveys a strong grainy texture

2: A side angle shot of a smiling elegant woman with a cup of coffee sitting at the wooden table in a sunny crowded cafe. She is wearing a gucci turtle neck. Shadows casting through the windows. Captured in style of Roman Polanski, on Lomography Color Negative 800, depth of field, monochromatic

3: A side angle shot of a smiling elegant woman with a cup of coffee sitting at the wooden table in a sunny crowded cafe. She is wearing gucci turtle neck. Shadows casting through the windows. Captured in style of Brian De Palma, colourful, intricate details

Midjourney знает многих деятелей искусства, но не всех. Посмотреть, кого она уважает и примет в качестве референса, можно на сайте Midlibrary.

Параметры

Это техническая часть промпта, где человеческим языком уже не обойтись. Большая часть параметров нужны для тонкой настройки результата, так что красивые вещи можно делать и без них. С ними лишь немного более предсказуемо.

Параметр --s 750, например, отвечает за стилизацию изображения. На примерах ниже видно, как меняется картинка, если мы его настроим. Если коротко, то чем значение параметра выше, тем все роскошнее:

1: A beautiful Iberis flower on a dark blue gradient background, flickr, whimsical minimalism, wollensak 127mm f/4.7 ektar, national geographic photo --s 900

2: A beautiful Iberis flower on a dark blue gradient background, flickr, whimsical minimalism, wollensak 127mm f/4.7 ektar, national geographic photo --s 500

3: A beautiful Iberis flower on a dark blue gradient background, flickr, whimsical minimalism, wollensak 127mm f/4.7 ektar, national geographic photo --s 0

Если вам нужен подробный и полный разбор параметров, советую Midjourney Cheatsheet. Там детально и с примерами рассматриваются все параметры актуальной версии. На английском.

Я искренне старался составить хорошую статью для вас и теперь чувствую некое моральное право прорекламировать себя. Подписывайтесь на мой телеграм-канал. Там лампово, как в раннем интернете. И посты редко выходят. Но вдумчиво и я там ничего не продаю. Вообще, если ваша работа как-то связана с дизайном, технологиями и психологией — возможно, нам стоит работать вместе. Пишите в личку по любому поводу. Спасибо!

Гайд по нейросетям для тех, кто как раз собирался попробовать

Договоримся о терминах

Большие языковые модели

Варианты использования

Выбор инструмента

Начало работы

Структура промпта

Генерация изображений

Выбор инструмента

Начало работы

Структура промпта