Что может ИИ? Шпаргалка для заказчика

Итак, у нас в разгаре хайп на генеративные нейронные сети. И биржи заказов трещат от гениальных предпринимательских идей. “Чудо” вычислительно золотого ChatGPT заставило многих поверить в будущее технологии, однако, как это часто бывает, вера опережает реальность. В этой статье я хочу поделиться с вами своим реальным опытом общения с клиентами, проанализировать распространенные заблуждения, и раскрыть, возможно, для кого-то глаза на то, как устроена технология, и как на нее стоит смотреть с точки зрения предпринимателя.

Кейс № 1: ИИ — Дизайн студия

Задача:
пользователь вводит текстовое описание вида “хочу оформить гостиную в стиле барокко размером 10x12x4 м, одно окно слева, другое справа, посередине широкая дверь”, а на выходе ему выдается 10 вариантов 3D-рендера, он выбирает нужный и получает за $20 готовую смету на материалы, мебель с конкретными поставщиками, а также чертежи — этажные планы (по ГОСТу).

Что думает клиент:
Я видел, что можно по запросу нарисовать классный дизайн! Осталось прикрутить сюда реальные товары и чертежи — и все готово. Есть же ИИ! Можно сделать за $10,000

Какова реальность:
Одно дело — это натренировать на базе открытой базе данных Dribble с готовыми описаниями нейросеть, которая рисует красивые картинки, и совсем другое — из текстового запроса сделать реальный проект в 3D (а иначе вы не получите ни чертежи не рендер). Отдельная сложность — это подключить реальные товары к такой модели.

Каково реальное решение:
1) разметить базу данных реальных дизайнерских проектов с чертежами (не менее 10,000) по параметрам типов элементов мебели, видов материалов отделки, способов размещения в пространстве;

2) Обучить на этой базе данных нейросеть;

3) Построить пайплайн генерации решений с автоматическим 3D-рендером / провести дообучение по обратной связи;

4) подключить в разметку типов мебели и отделочных материалов каталоги, с размеченными параметрами габаритов.

Бюджет: от $1000,000

В чем клиент заблуждается:
Если есть картинка, то “осталось чуть чуть”. Можно же что-то взять и как-то скомбинировать.

Можно: можно натренировать более простую нейросеть определять материалы по картинкам, но нельзя сделать чертежи.

Можно генерировать при помощи ChatGPT код для Autocad-чертежей по изначальному запросу.

Можно дополнять пользовательский запрос экспертно-продуманными промптами по размещению мебели или выбору типов отделки (что тоже по себе длительная работа по трудозатратам) и в итоге — нет никаких гарантий, что вы получите приемлемое для клиента качество.

Однако многие студии разработки, как я понимаю, в такие детали предпочитаю не вдаваться, и гарантий качества не дают. Так что я ожидаю что в ближайшее время появится множество буллшит-сервисов для дизайнеров интерьеров, которые не столько упростят им работу, сколько поменяют им стиль работы — они будут не рисовать интерьеры, а объяснять почему сгенерированный вариант — говно.

Кейс № 2: Генератор SEO-ready сайтов

Задача:
пользователь пишет идею сайта, на выходе готовый сайт, заточенный под SEO.

Что думает клиент:
Я видел уже генератор сайтов для стартапов, значит можно сделать такое-же по любой теме с большим количеством блоков.

Ожидания: $5,000

Какова реальность:
Сайты для стартапов строятся по очевидной схеме / структуре. ChatGPT легко закрывает задачу генерации контента по этой схеме. Достаточно подобрать штук 10 шаблонов, добавить вариативность цветовой схемы, подбор / генарацию логотипов на базе решений того же OpenAI и задача решена.

Каково реальное решение:
Чтобы генерировать SEO-ready сайты по любой тематике:

1) размечаем базу данных из 10,000+ SEO-ready шаблонов сайтов различных тематик на блоки, и типы контента с учетом знаний сеошников, тэгируем тематики;

2) Готовим инструкции для разметчиков в каком нибудь MechanicalTurk;

3) Готовим инфраструктуру чтобы закачивать их результаты;

4) Оплачиваем труд экспертов-модераторов (каждый 10-й отчет модерируем);

5) Учитывая что задания должны быть максимально простые, то скорее всего разбиваем это 10,000 на 10, и получаем 100,000 экземпляров заданий (допустим по 10 центов каждое);

6) все это при участии аналитика и ML-инженера на зарплате занимает несколько месяцев;

7) при помощи знаний SEO-’экспертов структурируете задания и промпты для ChatGPT на генерацию контента для выбранного шаблона;

8) на реальных пользователях тренируете отдельную нейросеть еще и выбирать шаблоны, которые изначально можно подбирать по ключевым словам.

Бюджет: от $500,000

В чем клиент заблуждается?
Если есть сервис который фигачит сайт для одной темы, то можно «просто добавить” темы, и »прикрутить” туда SEO-знания.

Нет, друзья, нельзя. Или, можно сказать можно, но только ценой того самого стартапа, который сделал это для одной темы. Если вы хотите покрыть “все” темы, то умножайте на 100 или на 200. Ну, или можно сделать какой-то сомнительный по качеству булшит, который подойдет разве что для развлечения и увеличения хайпа.

Так что делать и как подходить к оценке задачи?

Ключевая проблема — в ожидаемом уровне качества. Красивые картинки многим сорвали крышу, но люди не учитывают, что эти картинки созданы на открытых данных из открытых источников.

И на самом деле эти картинки ничего не меняют — те же дизайнеры, вебмастеры и программисты просто будут эффективнее работать, потому что у них появились помощники. Они им снизят трудозатраты. (Хотя, по своему опыту разработки, скажу, что очень сомнительная ценность генераторов кода. У меня и так автоматизирована половина работы — и я пока не нашел существенного эффекта на потоке от применения ИИ в разработке).

Так вот, про качество: зачастую людям кажется что они могут поменять рынок простой комбинацией ИИ-инструментов, выдавая приемлемое качество за минимальные деньги.

И в этом кроется ответ на вопрос как оценивать: если ваша задумка выбрасывает с рынка какую-либо профессию (например дизайнера, чертежника или еще кого-то), то вы должны оценивать необходимые вложения как минимум 1% объема этого рынка труда.

Если вы хотите переложить качество предлагаемое экспертом в компьютер — будьте готовы оплатить экспертам как минимум время, затраченное на тренировку компьютера. Если ваша задумка выбрасывает целый сектор рынка.. ответ также прост — закладывайте не менее 1% этого рынка в создание подобной технологии.

А как же ChatGPT?

ChatGPT - не заменяет никакой рынок. Он заменяет болтовню. Иногда эта болтовня соответствует реальности, иногда нет. Что-то он болтает вполне корректно, и где-то его можно использовать, если структурировать знания и построить структуру формулировки вопросов, но в итоге вы упираетесь в вопрос качества. Поэтому есть множество сервисов на базе ChatGPT или DALL-E, которые кажутся фантастически эффективными, но на деле - это всегда полу-решения, помощник эксперту, B2B инструмент, который меняет и упрощает труд, но не меняет структуру рынка.

А прорывы?

Прорывов никто не отменяет, но важно понимать, где именно стоит искать прорывы: на примере такого рода кейсов (а я просто поленился описывать больше) - проблему может решить универсальная технология структурирования знаний. Важно максимально (при помощи того же AI) снизить трудозатраты эксперта на оценку результата работы нейросети, либо - создать очень удобный и эффективный инструмент, который позволит опрашивать эксперта на предмет его знаний. Это - задача трансляции знаний из произвольной системы координат (тем не менее обеспечиваемой OpenAI), в заданную структуру.
Однако, когда такая технология будет создана, то она по задумке будет выходить за рамки любого прикладного проекта.

44
Начать дискуссию