«Если за генеративным ИИ будущее, то жизненно важным навыком станет написание запросов для него» Статьи редакции

Так считает колумнист The Atlantic Чарли Ворцел. Правда, он не исключает, что однажды нейросети будут справляться даже с абстрактными вводными — как это было с поисковыми системами.

Интерфейс маркетплейса PromptBase, где можно купить запрос для нейросети

«Проповедники» идеи о могуществе искусственного интеллекта считают, что за его генеративными моделями будущее не только поисковых систем, но ещё преподавания, писательства и искусства.

Пока вокруг темы слишком много шумихи, оценить реалистичность таких прогнозов трудно. Однако если «проповедники» окажутся правы, одним из жизненно необходимых навыков в 21 веке может стать умение общаться с машиной на одном языке, считает колумнист The Atlantic и NYT Чарли Ворцел.

Речь о составлении для нейросетей подробных инструкций, которые, по словам журналиста, бывают гораздо интереснее, чем конечный продукт их труда, — и неважно, для Midjourney эта инструкция или для ChatGPT.

Когда пользователи делятся изображениями или сочинениями, созданными ИИ, они часто прикладывают к ним и сам запрос, с помощью которого они воплотили задумку в жизнь. Таким образом они дают нам шанс проникнуть в их мозг и увидеть, как он соединяет ничем не связанные фрагменты знаний, трактует задачи, испытывает весь свой творческий потенциал.

Чарли Ворцел, колумнист

Если попросить ChatGPT написать «сводку о “Скотном дворе” из пяти абзацев», результат, скорее всего, выйдет крайне непримечательным и, возможно, даже неточным.

Другое дело, если автор отправит боту небольшое вступление для своего будущего эссе и просит систему его продолжить, а не написать с нуля. А ещё лучше — если даст много вводных. Например: «Напиши сочинение на пять абзацев, которое отвечало бы требованиям вуза, в художественной прозе по сатирическому и полному аллегорий роману “Скотный двор”. Объясняя стилистические приёмы писателя, обратись к работе Оруэлла “Почему я пишу”».

Сам журналист составлять конкретные запросы не умеет. Однажды он взялся помочь восьмилетнему племяннику воплотить на экране образ с помощью Midjourney — блоху, которая держалась на волнах цунами и параллельно с этим сражалась с гигантской осой. Сначала блоха от ИИ выглядела недостаточно мультяшно, а потом, наоборот, стала «пугающе реалистичной».

Для помощи таким неумёхам энтузиасты сформировали целый новый рынок — рынок генерации запросов для ИИ. На сайте PromptBase, например, можно купить готовые инструкции для DALL-E, GPT-3, Midjourney, Stable Diffusion и ChatGPT. Вот несколько услуг с сайта:

Там же можно нанять «разработчика запросов» под конкретный проект или продать свои собственные инструкции. На этом один из таких «торговцев» — пользователь Imagineer — заработал с сентября 2022 года свыше €800.

Он считает, что эффективно управляться с Midjourney ему помогают знания в области дизайна, иллюстраций и фотографии. Однако ключом к успеху он называет свою готовность совершенствовать навык составления инструкций. «Чтобы предсказывать итог и придумывать последовательные запросы, нужно понимать, как всего одно слово или один параметр может повлиять на результат», — говорит Imagineer.

Для этого он часто раз за разом меняет детали вводных, а после анализирует, как эти изменения сказались на конечном продукте.

Генератор изображений и «чёрный ящик» в одном: руководство по использованию нейросети Midjourney Статьи редакции

«Пражская медиашкола» составила гид по сети с Discord-фронтендом. В нём — как формулировать запросы, какие параметры прописывать и для чего, а также какие инструменты и справочники помогут тем, кто против метода «тыка».

«McDonald’s под водой» от Midjourney. Источник: jeffhandesign, Design Your Trust

О важности знаний в предметной области говорят и авторы инструкций для текстовых ИИ — например, предприниматель и блогер Дэн Шиппер. Он может попросить бота вывести основные тезисы философской концепции, но только если он и без бота знает, что она из себя представляет. Без этого он не сможет быстро оценить полученный текст на наличие ошибок.

Шиппер сравнивает работу с ChatGPT с обучением энергичного джуна. Чат-бот, как и молодой специалист, полон энтузиазма и творческого потенциала, но неопытен и склонен допускать ошибки и «нести ерунду, когда не знает ответа». Направить его может только грамотный и знающий свою работу менеджер, считает предприниматель.

Писательница Мэг Конли, в свою очередь, отмечает, что написание хорошего запроса — это то же, что и написание самого эссе: «Задача крайне сложная, и на выходе часто получается ерунда. Но всё перекрывает радость от момента, когда всё-таки удаётся подобрать нужные слова и воплотить в жизнь образы из головы». Она, как и Imagineer, часами оттачивает этот навык, раз за разом скармливая нейросети видоизменённые запросы.

По словам Конли, каждая ИИ-модель отличается «уникальными эстетикой и языком» — как люди, живущие в одной стране, но говорящие на разных региональных диалектах и гордящиеся особыми культурными различиями.

Именно поэтому человек, который эффективно управляется со Stable Diffusion, необязательно умеет давать ясные инструкции ChatGPT.

Ещё одна сложность кроется в том, что в запросе важен даже порядок слов. Например, если поставить прилагательное, описывающее объект, после самого объекта, нейросеть сосредоточится в первую очередь на прорисовке объекта, а уже потом на задаче, которую ставит прилагательное.

Из-за этого составление длинных инструкций превращается в самую настоящую головоломку. А сам запрос может быть таким:

Стиль — метафизическая живопись, рисунок цветным карандашом со Smooth Shading & Blending (плавные растушевка и цветовые переходы — vc.ru), восходящее солнце отражается в пруду, скрывающемся в глубине лесной чащи, ивовые ветви раскинулись над кромкой пруда, давящее угрюмое настроение, естественное освещение, Hyperdetailed (высокая детализация), High Contrast (высокая контрастность), сложные детали, фотореализм, трассировка лучей, Octane Render и Unreal Engine (графические движки), -ar 3:2 -s 999 -v4.

Часть деталей в этой инструкции — личные пожелания автора, но другая — это запросы, основанные на конкретных инструментах, которые есть в продукте. Это и определённые движки, и настройка стилей, оптики и рендеров, и версия нейросети, и соотношение сторон.

Некоторые преподаватели зарубежных вузов не исключают, что составление рабочих инструкций — то, что понадобится их студентам в их будущей карьере. Для этого профессор Пенсильванского университета Итан Моллик, например, даже изменил свой учебный курс. Он предлагает ученикам представить себя в роли учителей и позаниматься с ChatGPT.

Согласно заданию, студенты должны получить от бота хорошее эссе о какой-нибудь научной концепции, разобранной в классе. Для этого они оценивают результат и каждый раз либо изменяют запрос, пока не добьются желаемого, либо просят изменить что-то в уже полученном тексте. По словам Моллика, это, во-первых, поможет студентам усвоить тему, во-вторых, научит их лучше общаться с машиной.

Ворцелу обсуждения вокруг написания запросов напоминают первую веху развития поисковых систем: раньше только «гики» знали, что улучшить поисковую выдачу можно с помощью специальных операторов вроде скобок и кавычек, а также ключевых слов, требований к источнику или ограничений по дате.

Правда, со временем алгоритмы научили понимать даже самые абстрактные и неполные просьбы. Возможно, то же произойдёт и на рынке ИИ-решений.

«Экзамен сдал, но на троечку»: как чат-бот ChatGPT пытался выпуститься из университетов Статьи редакции

Спойлер: с трудом. Но учёные отмечают, что с простыми вопросами он справляется не хуже студентов.

Источник: Showmetech
0
7 комментариев
Написать комментарий...
Вадим Д.

Если рядовой пользователь будет генерить запросы, как к обычному специалисту: дизайнеру или программисту, ничего не изменится. Настоящий специалист будет переводить бред заказчика в адекватные запросы.

Ответить
Развернуть ветку
Яна Синдеева

Будет ещё один ИИ специализирующийся на написании запросов для остальных ИИ:)

Ответить
Развернуть ветку
Maxim Sergeevich

Уже есть немало кейсов, когда ChatGPT ставили задачу придумать запрос для Midjourney

Ответить
Развернуть ветку
Неопознанный Енот

Будут генерить на обычном человеческом языке, с появлением chatGPT это стало очевидно. «Промт-инженер» это очень временно.
OpenAi уже открыли апишку, и любой бизнес может интегрировать аи-фичи в свои приложеньки не вставая с дивана, а мы еще даже не начали.
Знания в предметной области - да, какие-то специальные навыки для создания запросов - нет

Ответить
Развернуть ветку
Дарья Труханова

Если голова работает, эти промпты составлять не проблема. Да только не нужны эти генеративные аи. Пускай творчеством занимаются талантливые люди, а не машины. И так людского ничего почти не осталось в нас.

Ответить
Развернуть ветку
Ann Mall

Придумывают сейчас. Обучение как работать с гпт и тд. Там же запрос делаешь и уже понятно, как он работает. Просто подробно надо задание давать

Ответить
Развернуть ветку
Богдан В.

Очевидные вещи - чтобы пользоваться системой, нужно уметь совершать определенные действия для получения ожидаемого ответа/результата.

Но я уже сейчас начинаю подозревать, что с современными темпами деградации интеллекта человечества все сведётся к тому, что спецы, работающие своими руками и головой будут получать ещё больше.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
4 комментария
Раскрывать всегда