Изучение возможностей в цепочке создания ценности генеративного ИИ

В течение 2022 и в начале 2023 года технологические инноваторы массово запустили генеративный ИИ, поразив лидеров бизнеса, инвесторов и общество в целом способностью технологии создавать совершенно новые и, казалось бы, созданные человеком тексты и изображения.

Реакция была беспрецедентной.

Всего за пять дней миллион пользователей обратились к ChatGPT - генеративной языковой модели ИИ от OpenAI, которая создает оригинальный контент в ответ на подсказки пользователя. Компании Apple потребовалось более двух месяцев, чтобы достичь такого же уровня принятия iPhone. Facebook пришлось ждать десять месяцев, а Netflix - более трех лет, чтобы создать такую же пользовательскую базу.

И ChatGPT не один в индустрии генеративного ИИ. Пакет Stability Diffusion от Stability AI, который может генерировать изображения на основе текстовых описаний, получил более 30 000 звезд на GitHub в течение 90 дней после выпуска - в восемь раз быстрее, чем любой предыдущий пакет.

Эта волна ажиотажа вызвана не только тем, что организации только пробуют свои силы. Примеры использования генеративного ИИ уже появляются в различных отраслях. Гигант финансовых услуг Morgan Stanley тестирует технологию, чтобы помочь своим финансовым консультантам лучше использовать знания из более чем 100 000 исследовательских отчетов компании. Правительство Исландии сотрудничает с OpenAI в своих усилиях по сохранению находящегося под угрозой исчезновения исландского языка. Salesforce интегрировала технологию в свою популярную платформу управления взаимоотношениями с клиентами (CRM).

Бешеные темпы развития технологии генеративного ИИ и появления на рынке новых вариантов использования заставили инвесторов и руководителей компаний искать ответы на вопросы об экосистеме генеративного ИИ. В то время как глубокое погружение в стратегию CEO и потенциальную экономическую ценность, которую технология может создать в глобальном масштабе в различных отраслях, еще впереди, здесь мы делимся взглядом на состав цепочки создания стоимости генеративного ИИ. Наша цель - предоставить базовое понимание, которое может послужить отправной точкой для оценки инвестиционных возможностей в этом быстро развивающемся пространстве. Наши оценки основаны на первичных и вторичных исследованиях, включая более 30 интервью с основателями компаний, генеральными директорами, главными учеными и бизнес-лидерами, работающими над коммерциализацией технологии; сотни рыночных отчетов и статей; а также данные исследований McKinsey.

Для понимания цепочки создания стоимости генеративного ИИ полезно иметь базовые знания о том, что такое генеративный ИИ и чем его возможности отличаются от "традиционных" технологий ИИ, которые компании используют, например, для прогнозирования оттока клиентов, прогнозирования спроса на продукцию и составления рекомендаций по наилучшему продукту.

Ключевым отличием является его способность создавать новый контент. Этот контент может быть представлен в различных формах, включая текст (например, статьи или ответы на вопросы), изображения, похожие на фотографии или картины, видео и трехмерные представления (например, сцены и пейзажи для видеоигр).

Даже на ранних этапах развития этой технологии результаты работы генеративного ИИ впечатляют, они завоевывают награды в области цифрового искусства и входят в 10 процентов лучших участников многочисленных тестов, включая экзамен для юристов в США и экзамен по математике, чтению и письму в рамках SATs, вступительного экзамена в колледж, используемого в США.

Большинство генеративных моделей ИИ создают контент в одном формате, но появляются и мультимодальные модели, которые могут, например, создать слайд или веб-страницу с текстом и графикой на основе подсказки пользователя.

Все это стало возможным благодаря обучению нейронных сетей (тип алгоритма глубокого обучения) на огромных объемах данных и применению "механизмов внимания" - техники, которая помогает моделям ИИ понять, на чем нужно сосредоточиться. С помощью этих механизмов генеративная система ИИ может определять шаблоны слов, взаимосвязи и контекст подсказки пользователя (например, понять, что "синий" в предложении "Кошка сидела на коврике, который был синим" означает цвет коврика, а не кошки). Традиционный ИИ также может использовать нейронные сети и механизмы внимания, но эти модели не предназначены для создания нового контента. Они могут только описывать, предсказывать или предписывать что-то на основе существующего контента.

По мере разработки и развертывания систем генеративного ИИ появляется новая цепочка создания стоимости для поддержки обучения и использования этой мощной технологии. С первого взгляда можно подумать, что она очень похожа на традиционную цепочку создания стоимости ИИ. В конце концов, из шести категорий верхнего уровня - компьютерное оборудование, облачные платформы, базовые модели, центры моделей и операции машинного обучения (MLOps), приложения и услуги - только базовые модели являются новым дополнением (Рисунок 1).

Однако при более глубоком рассмотрении обнаруживаются некоторые существенные различия в возможностях рынка. Начнем с того, что основы систем генеративного ИИ значительно сложнее, чем большинство традиционных систем ИИ. Соответственно, время, стоимость и опыт, связанные с их созданием, создают значительные препятствия для новых участников и небольших компаний во всех звеньях цепочки создания стоимости. Несмотря на то, что во всех областях существуют очаги ценности, наше исследование показывает, что во многих областях в обозримом будущем будут продолжать доминировать технологические гиганты и компании, занимающие лидирующие позиции.

Рынок приложений генеративного ИИ - это та часть цепочки создания стоимости, которая, как ожидается, будет развиваться наиболее быстрыми темпами и предложит значительные возможности для создания стоимости как существующим технологическим компаниям, так и новым участникам рынка. Компании, использующие специализированные или собственные данные для тонкой настройки приложений, могут получить значительное конкурентное преимущество перед теми, кто этого не делает.

Для создания контента системам генеративного ИИ нужны знания - и их много. Например, OpenAI GPT-3, генеративная модель ИИ, лежащая в основе ChatGPT, обучалась на 45 терабайтах текстовых данных (что сродни почти миллиону футов книжной полки).

Это не то, с чем может справиться традиционное компьютерное оборудование. Для таких нагрузок требуются большие кластеры графических процессоров (GPU) или тензорных процессоров (TPU) со специализированными "ускорительными" чипами, способными параллельно обрабатывать все эти данные по миллиардам параметров.

После завершения обучения этой базовой генеративной модели ИИ предприятия могут использовать такие кластеры для настройки моделей (этот процесс называется "тюнинг") и запускать эти требовательные к мощности модели в своих приложениях. Однако, по сравнению с первоначальным обучением, эти последние шаги требуют гораздо меньше вычислительной мощности.

Несмотря на наличие нескольких более мелких игроков, разработка и производство этих специализированных процессоров ИИ сосредоточены в одних руках. NVIDIA и Google доминируют на рынке разработки чипов, а один игрок, Taiwan Semiconductor Manufacturing Company Limited (TSMC), производит почти все чипы ускорителей. Новые участники рынка сталкиваются с высокими стартовыми затратами на исследования и разработки. Разработчики традиционного оборудования должны развивать специализированные навыки, знания и вычислительные возможности, необходимые для обслуживания рынка генеративного ИИ.

GPU и TPU дороги и дефицитны, поэтому большинству компаний сложно и нерентабельно приобретать и поддерживать эту жизненно важную аппаратную платформу на месте. В результате большая часть работы по созданию, настройке и запуску крупных моделей ИИ выполняется в облаке. Это позволяет компаниям легко получать доступ к вычислительным мощностям и управлять их расходованием по мере необходимости.

Неудивительно, что крупные облачные провайдеры имеют наиболее полные платформы для выполнения генеративных рабочих нагрузок ИИ и преимущественный доступ к аппаратному обеспечению и чипам. Специализированные облачные платформы могут завоевать свою долю рынка, но не в ближайшем будущем и не без поддержки крупных предприятий, стремящихся уменьшить свою зависимость от гипермасштабирования.

В основе генеративного ИИ лежат фундаментные модели. Эти большие модели глубокого обучения предварительно обучены для создания определенного типа контента и могут быть адаптированы для поддержки широкого спектра задач. Фундаментальная модель подобна швейцарскому армейскому ножу - ее можно использовать для разных целей. Как только базовая модель разработана, любой может создать на ее основе приложение, чтобы использовать ее возможности по созданию контента. Рассмотрим OpenAI GPT-3 и GPT-4 - базовые модели, способные создавать текст человеческого качества. На них работают десятки приложений, от широко обсуждаемого чат-бота ChatGPT до программных генераторов контента Jasper и Copy.ai, предоставляемых по принципу "программное обеспечение как услуга" (SaaS).

Модели Foundation обучаются на огромных массивах данных. Это могут быть как публичные данные, взятые из Википедии, правительственных сайтов, социальных сетей и книг, так и частные данные из больших баз данных. OpenAI, например, сотрудничает с Shutterstock для обучения своей модели изображений на собственных изображениях Shutterstock.

Разработка фундаментальных моделей требует глубоких знаний в нескольких областях. Они включают подготовку данных, выбор архитектуры модели, которая может создать целевой результат, обучение модели, а затем настройку модели для улучшения результатов (что подразумевает маркировку качества результатов модели и их возвращение в модель, чтобы она могла учиться).

В настоящее время обучение моделей фундамента, в частности, требует больших затрат, учитывая повторяющийся характер этого процесса и значительные вычислительные ресурсы, необходимые для его поддержки. В начале процесса обучения модель, как правило, выдает случайные результаты. Чтобы улучшить следующий результат, чтобы он больше соответствовал ожидаемому, алгоритм обучения корректирует веса базовой нейронной сети. Для достижения желаемого уровня точности это может потребоваться сделать миллионы раз. В настоящее время такие тренировки могут стоить миллионы долларов и занимать месяцы. Например, обучение OpenAI GPT-3, по оценкам, стоит от 4 до 12 миллионов долларов. В результате, в настоящее время на рынке доминируют несколько технологических гигантов и стартапов, поддерживаемых значительными инвестициями (Рисунок 2). Однако ведется работа по созданию более компактных моделей, способных обеспечить эффективные результаты при выполнении некоторых задач и более эффективное обучение, что в конечном итоге может открыть рынок для большего числа участников. Мы уже видим, что некоторые стартапы достигли определенных успехов в разработке собственных моделей - Cohere, Anthropic и AI21, среди прочих, создают и обучают свои собственные большие языковые модели (LLM). Кроме того, существует сценарий, при котором большинство крупных компаний захотят, чтобы LLM работали в их среде - например, для повышения уровня безопасности и конфиденциальности данных, среди прочих причин - и некоторые игроки (например, Cohere) уже предлагают подобные услуги, связанные с LLM.

Важно отметить, что еще предстоит ответить на многие вопросы, касающиеся прав собственности и прав на данные, используемые при разработке этой зарождающейся технологии, а также на полученные результаты, что может повлиять на развитие технологии (читайте врезку ниже "Некоторые из ключевых вопросов, определяющих будущее генеративного ИИ").

На фоне огромного энтузиазма вокруг технологии генеративного ИИ возникло множество вопросов, ответы на которые, вероятно, определят дальнейшее развитие и использование. Ниже приведены три наиболее важных вопроса, которые необходимо учитывать при оценке того, как будет развиваться экосистема генеративного ИИ:

Можно ли использовать для обучения моделей данные, защищенные авторским правом или личные данные? При обучении моделей Foundation разработчики обычно "соскабливают" данные из Интернета. Иногда это могут быть изображения, защищенные авторским правом, новостные статьи, данные социальных сетей, персональные данные, защищенные Общим положением о защите данных (GDPR), и многое другое. Действующие законы и нормативные акты неоднозначны с точки зрения последствий такой практики. Прецеденты, вероятно, будут развиваться, чтобы установить ограничения на соскабливание данных, являющихся собственностью компании, которые могут быть размещены в Интернете, или дать возможность владельцам данных ограничить или отказаться от участия в поисковых индексах, чтобы их данные не могли быть легко найдены в Интернете. Также, вероятно, появятся новые модели компенсации для владельцев данных.
Кому принадлежат творческие результаты? Действующие законы и правила также не дают четкого ответа на вопрос, кому принадлежит авторское право на конечный "выход" системы генеративного ИИ. Несколько потенциальных участников могут разделять или владеть исключительными правами на конечные результаты, например, владелец набора данных, разработчик модели, владелец платформы, создатель подсказки или дизайнер, который вручную дорабатывает и предоставляет конечный результат генеративного ИИ.
Как организации будут управлять качеством результатов работы генеративного ИИ? Мы уже видели множество примеров того, как системы выдавали неточный, подстрекательский, предвзятый или плагиат контент. Неясно, смогут ли модели устранить такие результаты. В конечном итоге всем компаниям, разрабатывающим приложения генеративного ИИ, потребуются процессы для оценки результатов на уровне конкретного использования и определения того, где потенциальный вред должен ограничивать коммерциализацию.

Чтобы создавать приложения на основе базовых моделей, предприятиям необходимы две вещи. Во-первых, место для хранения и доступа к базовой модели. Во-вторых, им могут понадобиться специализированные инструменты, технологии и методы MLOps для адаптации базовой модели и ее развертывания в приложениях для конечных пользователей. Это включает, например, возможности включения и маркировки дополнительных учебных данных или создания API, позволяющих приложениям взаимодействовать с ними.

Концентраторы моделей предоставляют такие услуги. Для моделей с закрытым исходным кодом, исходный код которых не предоставляется в открытый доступ, разработчик базовой модели обычно выступает в качестве центра моделирования. Он предоставляет доступ к модели через API на основе лицензионного соглашения. Иногда поставщик также предоставляет возможности MLOps, чтобы модель можно было настраивать и внедрять в различные приложения.

Для моделей с открытым исходным кодом, которые предоставляют код, который каждый может свободно использовать и изменять, появляются независимые центры моделей, предлагающие целый спектр услуг. Некоторые из них могут выступать только в качестве агрегаторов моделей, предоставляя командам ИИ доступ к различным базовым моделям, включая те, которые были адаптированы другими разработчиками. Затем команды ИИ могут загружать модели на свои серверы, дорабатывать и внедрять их в свои приложения. Другие компании, такие как Hugging Face и Amazon Web Services, могут предоставлять доступ к моделям и сквозным возможностям MLOps, включая опыт по настройке базовой модели с использованием собственных данных и ее развертыванию в приложениях. Последняя модель заполняет растущий пробел для компаний, желающих использовать технологии генеративного ИИ, но не имеющих для этого собственных специалистов и инфраструктуры.

Если одна базовая модель способна выполнять широкий спектр задач, то приложения, созданные на ее основе, позволяют выполнить конкретную задачу - например, помочь клиентам компании в решении вопросов обслуживания или составить маркетинговые письма (Рисунок 3). Эти приложения могут быть разработаны новым участником рынка, стремящимся предложить новое предложение, существующим поставщиком решений, работающим над добавлением инновационных возможностей к своим текущим предложениям, или компанией, стремящейся создать конкурентное преимущество в своей отрасли.

Существует множество способов, с помощью которых поставщики приложений могут создавать стоимость, ценность. По крайней мере, в ближайшей перспективе мы видим, что одна категория приложений обладает наибольшим потенциалом для создания стоимости. И мы ожидаем, что приложения, разработанные для определенных отраслей и функций, принесут больше пользы на ранних этапах развития генеративного ИИ.

В целом, мы считаем, что приложения генеративного ИИ относятся к одной из двух категорий. Первая представляет собой случаи, когда компании используют базовые модели в основном как есть в приложениях, которые они создают, с некоторыми изменениями. Они могут включать в себя создание индивидуального пользовательского интерфейса или добавление руководства и поискового индекса для документов, которые помогают моделям лучше понять общие запросы клиентов, чтобы они могли выдавать высококачественные результаты.

Вторая категория представляет собой наиболее привлекательную часть цепочки создания стоимости: приложения, использующие точно настроенные базовые модели - те, в которые были добавлены дополнительные данные или скорректированы их параметры - для получения результатов для конкретного случая использования. В то время как обучение базовых моделей требует огромного количества данных, является чрезвычайно дорогостоящим и может занять месяцы, тонкая настройка базовых моделей требует меньше данных, стоит дешевле и может быть выполнена за несколько дней, что делает ее доступной для многих компаний.

Разработчики приложений могут накапливать эти данные на основе глубокого знания отрасли или потребностей клиентов. Например, рассмотрим Harvey, генеративное приложение ИИ, созданное для ответа на юридические вопросы. Разработчики Harvey загрузили наборы юридических данных в OpenAI GPT-3 и протестировали различные подсказки, чтобы настроенная модель могла генерировать юридические документы, которые были намного лучше тех, которые могла создать первоначальная базовая модель.

Организации также могут использовать собственные данные, полученные в ходе ежедневных деловых операций. Например, разработчик программного обеспечения, создавший генеративного чат-бота ИИ специально для банков, может сотрудничать со своими клиентами для включения данных из чатов колл-центра, что позволит им постоянно повышать уровень обслуживания клиентов по мере роста их пользовательской базы.

Наконец, компании могут создавать собственные данные на основе циклов обратной связи, управляемых системой оценки конечного пользователя, например, системой "звезд" или системой оценки "палец вверх, палец вниз". OpenAI, например, использует последний подход для постоянного обучения ChatGPT, и OpenAI сообщает, что это помогает улучшить базовую модель. По мере того как клиенты оценивают качество полученного ими результата, эта информация снова поступает в модель, давая ей больше "данных" для создания нового результата, что улучшает ее последующую реакцию. По мере улучшения результатов, все больше клиентов начинают использовать приложение и предоставлять больше отзывов, создавая добродетельный цикл совершенствования, который может привести к значительному конкурентному преимуществу.

В любом случае разработчикам приложений необходимо следить за развитием генеративного ИИ. Технология развивается быстрыми темпами, и технологические гиганты продолжают выпускать новые версии генеративных моделей с еще большими возможностями. OpenAI, например, сообщает, что недавно представленная модель GPT-4 предлагает "более широкие общие знания и способности к решению проблем" для повышения точности. Разработчики должны быть готовы оценить затраты и преимущества использования этих достижений в своих приложениях.

Хотя в долгосрочной перспективе генеративный ИИ, вероятно, затронет большинство бизнес-функций, наши исследования показывают, что информационные технологии, маркетинг и продажи, обслуживание клиентов и разработка продуктов в наибольшей степени созрели для первой волны применения.

Информационные технологии. Генеративный ИИ может помочь командам в написании кода и документации. Уже существующие на рынке автоматические кодеры повысили производительность труда разработчиков более чем на 50 процентов, способствуя ускорению разработки программного обеспечения.
Маркетинг и продажи. Команды могут использовать приложения генеративного ИИ для создания контента для работы с клиентами. Ожидается, что в течение двух лет 30 процентов всех исходящих маркетинговых сообщений будет создаваться с помощью систем генеративного ИИ.
Обслуживание клиентов. Естественно звучащие, персонализированные чат-боты и виртуальные помощники могут обрабатывать запросы клиентов, рекомендовать быстрое решение и направлять клиентов к нужной им информации. Такие компании, как Salesforce, Dialpad и Ada, уже объявили о своих предложениях в этой области.
Разработка продуктов. Компании могут использовать генеративный ИИ для быстрого создания прототипов продуктов. Например, компании, занимающиеся медико-биологическими науками, уже начали изучать возможности использования генеративного ИИ для генерации последовательностей аминокислот и нуклеотидов ДНК, чтобы сократить этап разработки лекарств с нескольких месяцев до нескольких недель.

В ближайшей перспективе некоторые отрасли могут использовать эти приложения с большей эффективностью, чем другие. Индустрия СМИ и развлечений может стать более эффективной за счет использования генеративного ИИ для создания уникального контента (например, локализация фильмов без необходимости многочасового человеческого перевода) и быстрой разработки идей нового контента и визуальных эффектов для видеоигр, музыки, сюжетных линий фильмов и новостных статей. Ожидается, что банковские, потребительские, телекоммуникационные, медико-биологические и технологические компании получат значительный прирост операционной эффективности, учитывая их значительные инвестиции в ИТ, обслуживание клиентов, маркетинг и продажи, а также разработку продуктов.

Как и в случае с ИИ в целом, специализированные сервисы генеративного ИИ, безусловно, появятся, чтобы помочь компаниям заполнить пробелы в возможностях, поскольку они стремятся накопить опыт и сориентироваться в бизнес-возможностях и технических сложностях. Ожидается, что существующие поставщики услуг ИИ будут развивать свои возможности для обслуживания рынка генеративного ИИ. Нишевые игроки также могут выйти на рынок со специализированными знаниями для применения генеративного ИИ в рамках конкретной функции (например, как применять генеративный ИИ в рабочих процессах обслуживания клиентов), отрасли (например, консультирование фармацевтических компаний по использованию генеративного ИИ для поиска лекарств) или возможностей (например, как построить эффективные контуры обратной связи в различных контекстах).

Хотя технология генеративного ИИ и поддерживающая ее экосистема все еще развиваются, уже сейчас совершенно ясно, что приложения предлагают наиболее значительные возможности для создания стоимости. Те, кто сможет использовать нишевые или, еще лучше, собственные данные для тонкой настройки базовых моделей для своих приложений, могут рассчитывать на достижение наибольшей дифференциации и конкурентного преимущества. Гонка уже началась, о чем свидетельствует постоянный поток объявлений от поставщиков программного обеспечения - как существующих, так и новых участников рынка, предлагающих новые решения. В ближайшие недели и месяцы мы еще больше осветим перспективы создания стоимости в конкретных отраслях и функциях, а также влияние генеративного ИИ на глобальную экономику и будущее работы.

В статье использованы материалы исследований отчётов McKinsey & Company

Изучение возможностей в цепочке создания ценности генеративного ИИ

Генеративный ИИ (GenAI) порождает целую экосистему, от поставщиков оборудования до разработчиков приложений, которая поможет реализовать его потенциал для бизнеса.

Краткое объяснение генеративного искусственного интеллекта

Цепочка создания ценности: Шесть звеньев, но одно превосходит их все

Компьютерное железо

Облачные платформы

Модели основания

Некоторые из ключевых вопросов, определяющих будущее генеративного ИИ

Модельные узлы и MLOps

Приложения

Приложения, созданные на основе точно настроенных моделей, выделяются на фоне остальных

Определение первой волны влияния приложений по функциям и отраслям

Сервисы