Расцвет ИИ: с чего все начиналось, оценка потенциала и прогнозы развития от Sequoia Capital

Сейчас мы живем в захватывающей и одновременно пугающей эре генеративного искусственного интеллекта. Во время, когда исполнительный FOMO (страх упущенной возможности) может привести к досадным публичным провалам. Как с недавней презентацией чат-бота Bard, когда одномоментно корпорация Google потеряла 100 миллиардов долларов своей рыночной стоимости.
Мир вокруг нас претерпевает фундаментальные изменения, трансформируя то, как мы живем и работаем. Скоро ли генеративный ИИ из просто развлечения для пользователей станет надежным бизнес-помощником и обязательным критерием для конкурентного преимущества на рынке?

1. Текущий потенциал ИИ
2. Кейсы применения ИИ в работе — экономическая выгода для бизнеса
3. Основы современного ИИ
— Машинное обучение
— Нейронный сети
— Глубокие нейронные сети
4. Хронология развития ИИ: от простых моделей до генеративных. Что дальше
— Волна 1: господствуют маленькие модели (до 2015)
— Волна 2: Гонка за масштабированием (с 2015 по настоящее время)
— Волна 3: Лучше, быстрее, дешевле (2022+)
— Волна 4: Появляются приложения-убийцы (сейчас)
5. Рыночный ландшафт
— Модели: текст, генерация кода, изображения, синтез речи, видео и 3D-модели и другие области
6. Области применения
— Карта рынка генеративного ИИ от Sequoia Capital
7. Прогнозы
8. Ожидаемый прогресс фундаментальных моделей

В свежем отчете Forrester говорится, что генеративный ИИ может дополнять и улучшать существующие бизнес-процессы способами, которые ранее были невозможны. Иначе говоря, генеративный ИИ дает возможность расширить и даже автоматизировать существующие рабочие процессы в ИТ, маркетинге, обслуживании клиентов и других бизнес-функциях.

Игнорировать потенциал ИИ — значит допустить «дорогостоящую ошибку».
Forrester

Распространение ИИ может привести к созданию гибридной рабочей силы нового типа. Вскоре мы можем вступить в эпоху, когда все приложения, которые вы и любой другой работник умственного труда используете каждый день будут выполнять часть вашей работы за вас. Любая отрасль — от маркетинга до продаж, от рекламы до программирования, от архитектуры до графического дизайна, от социальных сетей до игр, от промышленности до медицины — нуждается в переосмыслении для достижения действительно внушительных результатов.

Правда в том, что ИИ способен изменить все. Хотя технологии на основе ИИ, возможно, никогда не достигнут научно-фантастического представления о самоуправляемых, самосовершенствующихся автономных системах, ИИ может иметь большое значение для оптимизации и значительного повышения производительности рабочих команд.

До недавнего времени у искусственного интеллекта не было шансов конкурировать с людьми в творческой работе — его компетенции были отнесены к анализу больших данных, прогнозированию и механическому труду. Текущий потенциал ИИ позволяет аналитическим моделям развивать в том числе когнитивные способности. Мощный класс больших языковых моделей позволяет машинам писать, кодировать, рисовать и творить с заслуживающими внимания, а иногда и сверхчеловеческими результатами.

С учетом ежедневно увеличивающегося объема данных прогресс машин происходит куда динамичнее, нежели человеческий.

IDC прогнозируют, что к 2025 году глобальная сфера данных вырастет до 163 зеттабайт (то есть триллиона гигабайт). Чтобы представить масштаб нагляднее, переведем зеттабайты в знакомую большинству плоскость: 1 ZB — это память около 34,4 миллиарда смартфонов с памятью 32 ГБ.

<i>Источник: "Data Age 2025: The Evolution of Data to Life-Critical"</i>

Поток данных позволяет когнитивным системам превращать анализ данных из ретроспективной практики в фактор принятия стратегических решений.

К 2025 году ожидается рост объема анализируемых данных, к которым "прикасаются” когнитивные системы, в 100 раз, или до 1,4 ZB.

Машины становятся умнее, и многие задачи, подвластные ИИ, и близко невыполнимы для человека. С механической работой машины справляются лучше и эффективнее, высвобождая ресурсы на куда более интересные и значимые задачи.

Люди умеют проводить аналитику вручную, но согласитесь — машины это делают куда эффективнее. Их возможности шире. Это позволяет им охватывать больший объем данных и выявлять закономерности, которые будут полезны для множества вариантов их дальнейшего использования: от прогнозирование ожидаемой даты прибытия доставки до рекомендаций в TikTok.

Но что, если наша цель — обучить машины не просто анализировать существующее, но и генерировать что-то радикально новое и масштабное. Что делать, если мы хотим обучить модели писать стихи или код, создавать игры или разрабатывать приложения. Именно в этом и заключается роль Генеративного ИИ.

Генеративный ИИ находится на пути к тому, чтобы давать результат не только быстрее и дешевле, но и в некоторых случаях качественно лучше, чем то, что люди создают вручную. Некоторые функции могут быть полностью заменены, прочие будут процветать благодаря тесному итеративному творческому циклу между человеком и машиной.

Области, которые он затрагивает — интеллектуальная и творческая работа — охватывают миллиарды работников. И это не означает, что ИИ станет их заменой. Но в его силах сделать специалистов как минимум на 10% более эффективными и креативными. Разве это не ключ для небывалого прогресс?

Точка потенциального роста генеративного ИИ заключается в том, чтобы машины свели предельные затраты на интеллектуальный труд к нулю, увеличив уровень производительности и создав огромную экономическую ценность.

В ближайшее время у нас на канале выйдет статья с обзором кейсов ведущих ритейлеров, которые применяют ИИ и увеличивают выручку на 40-85%.

Но из-за экономических препятствий и усиления конкуренции мы знали, что реклама на основе ИИ может дать нам преимущество <...> Наша стратегия окупилась. Нам удалось увеличить выручку на 40%.
Майкл Надбой, директор по маркетингу FragranceNet.com

Присоединяйтесь к нам в Telegram и следите за анонсом статьи
«4 шага, как маркетологи раскрывают потенциал ИИ уже сегодня»:

t.me

CyberBrain | digital marketing

Чтобы полноценнее понимать, с чем мы имеем дело, когда говорим об искусственном интеллекте, стоит разделить смежные с ним понятия, такие как машинное обучение, нейронные сети и глубокое обучение.

Искусственный интеллект — это название всей области, которая занимается автоматизацией процессов за счет машин. Машинное обучение — это особый способ создания искусственного интеллекта. Нейронные сети — это одна из множества моделей машинного обучения, которая использует структуру, аналогичную нейронам в мозгу, для выполнения вычислений и прогнозирования. А глубокое обучение — это машинное обучение, в котором используется архитектура определенного типа - глубокие нейронные сети.

Расцвет ИИ: с чего все начиналось, оценка потенциала и прогнозы развития от Sequoia Capital

В общем, подход машинного обучения можно описать как самостоятельное выявление и закрепление машиной правил и их применение при выполнении поставленных перед ней задач. Правила машина определяет на основе больших объемов данных и формирует из них наборы числовых параметров, которые и означают то, как она генерирует ответы на задаваемые вопросы. Их называют моделями машинного обучения, и они описывают способы обучения искусственного интеллекта. Иными словами, на каких данных машина может обучаться и какого рода вопросы ей следует задавать. Затем из всех моделей, или набора правил, отбираются наиболее справедливые для тех или иных задач. Так формируется память модели.

Можно сопоставить этот процесс с решением серии тестов, когда результаты за каждый последующий должны улучшаться в ходе исправления ошибок предыдущих. Каждая новая оценка определяет горизонт и план совершенствования для будущих тестирований. В этом и заключается обучение.

Нейронные сети формируются из нейронов, организованных в слои, где каждый слой выполняет набор простых вычислений и передает правильный ответ следующему. Чтобы воспроизвести линию или параболу, будет достаточно простой сети с несколькими слоями нейронов. А более сложные вычисления позволяет выполнять процесс стекирования слоев.

Глубокие нейронные сети выстраиваются из десятков или даже сотен нейронных слоев, за счет чего можно создавать действительно мощные модели. Благодаря репрезентативному свойству нейронные сети могут изучать данные всех видов сложности. Это позволило нам создавать алгоритмы, решающие проблемы, с которыми компьютеры раньше не справлялись.

Можно начать с уже имеющихся параметров, а затем переобучиться с новыми данными, тогда сеть будет поступательно улучшаться. В этом и заключается взрывной рост возможностей ИИ за последние пять или шесть лет - можно брать нейронные сети, обученные для одной цели, и адаптировать их для другой, получая невероятные результаты. На этом простом факте основаны некоторые из наиболее популярных ИИ сегодня — от распознавания изображений кошек в Facebook до тех алгоритмов, которые Amazon использует в магазинах с бескассовой оплатой.

к текущему моменту интернет агрегировал огромное количество данных для обучения
вычисления, особенно параллельные вычисления с использованием графических процессоров (GPU), сделали возможным работу с этими огромными наборами данных
глубокие нейронные сети позволили использовать эти наборы данных для создания чрезвычайно мощных моделей машинного обучения

И все это означает, что некоторые вещи, которые раньше были невозможными, теперь прогнозируемо достижимы в ближайшем будущем.

Чем больше данных и вычислений, тем лучше модели и тем оправданнее тот шум, который происходит вокруг него. Рассмотрим хронологию развития ИИ в общих чертах, чтобы представить текущий момент в контексте.

Волна 1: господствуют маленькие модели (до 2015)

Простые модели превосходно справлялись с аналитическими задачами: от прогнозирования времени доставки до классификации мошенничества. Однако они были недостаточно развиты для задач общего назначения. Создание текстов или кода на человеческом уровне остается несбыточной мечтой.

Волна 2: Гонка за масштабированием (с 2015 по настоящее время)

В знаковом документе от 2017 года Google Research описывается архитектура нейронной сети для понимания естественного языка, называемая Transformer, которая может генерировать языковые модели превосходного качества и при этом полностью исключать сложные рекуррентные и сверточные нейронные сети, а соответсвенно - требовать значительно меньше времени на обучение. Эти модели были предназначены для быстрого обучения и относительно легко адаптировались под конкретные предметные области.

<i>Источник: The Economist Newspaper Limited</i>

В период с 2015 по 2020 год объем вычислений, используемых для обучения этих моделей, увеличился на 6 порядков, а их результаты превзошли показатели производительности человека в распознавании почерка, речи и изображений и понимании языка и смысла прочитанного. GPT-3 от OpenAI выделился эффективностью модели — произошел гигантский скачок по сравнению с GPT-2.

<i>Источник: Compute Trends Across Eras of Machine Learning</i>

Учитывая весь прогресс фундаментальных исследований, эти модели не получили широкого распространения по нескольким причинам:

большой объем и высокий уровень сложности в использовании (требуется оркестровка графического процессора)
малодоступность (недоступны или доступны только в закрытом бета-тестировании)
дороговизна их внедрения в качестве облачных систем

Несмотря на эти ограничения, в это время начинают вступать в бой самые ранние приложения генеративного ИИ.

Волна 3: Лучше, быстрее, дешевле (2022+)

Вычислительные ресурсы становятся дешевле. Новые методы, такие как диффузионные модели, сокращают затраты, необходимые для обучения и проведения логических выводов. Исследовательское сообщество продолжает разрабатывать более совершенные алгоритмы и более крупные модели. Доступ разработчика расширяется от закрытой бета-версии до открытой или, в некоторых случаях, с доступом к исходному коду.

Для разработчиков, которым раньше не хватало доступа к LLM (Logic learning machine), теперь открыт доступ к исследованию и разработке приложений. Они начинают расцветать.

Волна 4: Появляются приложения-убийцы (сейчас)

Модели продолжают становиться лучше, быстрее и дешевле, а доступ к ним — глубокие нейронные сети позволили использовать эти наборы данных для создания чрезвычайно мощных моделей машинного обучения все более открытым. На этом этапе мы наблюдаем, как приложения полностью созрели для того, чтобы взорвать индустрии.

Здесь можно провести параллель с выходом iPhone на рынок мобильных устройств. Этот период стал переломным — начали появляться инновационные приложения, которые потянули за собой грандиозные изменения в экосистеме вокруг. Тогда потребовалось некоторое время, чтобы адаптироваться к тем условиям, которые изменили игру. В конце концов, эти мобильные приложения заставили среду взлететь на ракетном топливе с точки зрения пользовательского опыта использования и масштабного увеличения активной аудитории.

Точно так же, как в свое время был бум на новые типы приложений благодаря изобретениям по типу GPS, камер и устройств для связи на ходу, большие модели также стали мотивировать новую волну генеративных приложений ИИ. Гонка продолжается.

Ниже приведена схема, описывающая уровень платформы, на котором будет работать каждая категория, и потенциальные типы приложений, которые будут построены поверх них.

Текст
Сегодня модели прилично хороши с точки зрения написания коротких и средне форматных текстов на общие темы. Инструменты ИИ могут писать статьи, рекламу, контент-планы, сценарии, копии веб-страниц и практически любой другой тип текста, который вы можете придумать, в любом тоне или стилистике.
Но текущие возможности все же позволяют использовать эти тексты лишь для дальнейшей итерации или в качестве черновиков-заготовок. Выходные данные моделей по генерации текста представляют собой достаточно компетентные сводки информации. Хотя компетентный текст еще не означает структурно и логически проработанный.
Из моделей на текущем рынке можно упомянуть как ChatGPT, так и его последователей, которые сфокусированы преимущественно для задач копирайтинга. Например, Copy.AI, Cactus AI, Rytr, Copysmith, Closers Copy, которые упрощают быстрое создание большого объема материалов. Модели не только генерируют уникальный текст по короткому запросу, но и указывают источники и предлагает свой вариант структуры.
По мере улучшения моделей, мы ожидаем более качественные данные на выходе, в том числе более длинные тексты и улучшенные настройки по вертикали.
Сегодня также есть возможность создавать приложения для конкретных конечных рынков: от написания юридических контрактов до написания сценариев.
Генерация кода
Как показал GitHub CoPilot, ИИ окажет большое влияние на производительность разработчиков в ближайшем будущем. Уже существуют такие помощники для программного обеспечения, как Stability.ai или Tabnine, которые ускоряют работу над кодом за счет полнофункционального автозавершения кода. Также наблюдаются тенденции по упрощению кодинга в том числе для творческого использования ползователями без знаний кода. Активно развиваются Low-code и No-code платформы. Например, Blaze с помощью AI делает программирование более доступным, без конструктора приложений для написания кода.
Изображения
Появляются новые модели изображений с различными эстетическими стилями и методами редактирования уже сгенерированных изображений. Сегодня на рынке можно выделить MidJourney, DALLE-2 или SketchA от Open AI.
Синтез речи
Все мы давно знакомы с голосовым помощником Siri. Как и в случае с изображениями, современные модели служат отправной точкой для дальнейшего улучшения прикладных ИИ помощников еще и в корпоративной области. Планка высока, и искусственный интеллект однозначно смотрит в эту сторону. Можно ознакомиться с такими платформами, как Lalal.ai (удаление вокала без потери качества и разделения музыкальных источников), Mubert (генерация музыки из текста), UberDuck (генерация голоса из текста).
Видео и 3D-модели
Можно отметить высокий потенциал этих моделей для выхода на большие творческие рынки, такие как кино, игры, виртуальная реальность, архитектура и дизайн физических продуктов. Можно перейти и ознакомиться с платформами Point-E от OpenAI, Lumen.ai (контент для социальных сетей), Runway, Vidyo.ai и Designs.ai.
Другие области
Фундаментальные исследования и разработки моделей ведутся во многих областях, от аудио и музыки до биологии и химии (генеративные белки и молекулы). Microsoft предложил свою языковую модель для решения биомедицинских задач — BioGPT.

На приведенной выше диаграмме показана временная шкала, которая отображает ожидаемый прогресс фундаментальных моделей и связанных с ними приложений, которые потенциально могут стать возможными в ближайшее время. 2025 год и далее — это всего лишь предположение.

Вот некоторые из областей применения, хотя их гораздо больше, чем мы упоминаем в этом материале.

Копирайтинг
Растущая потребность в персонализированном контенте для стимулирования продаж и поддержании интереса к компании стала поводом для совершенствования языковых моделей.
Теперь маркетинговые тексты можно передать в их руки. На текущий момент им доступны преимущественно краткие формы. Спрос на автоматизированные и дополненные решения по тексту также стимулируется нехваткой времени и средств для маркетинговых и не только отделов.
Большинство помощников по письму сегодня горизонтальные. Дифференциация продукта по вертикали здесь заключается в тонкой настройке моделей и шаблонов UX для конкретных рабочих процессов.
Медиа, социальные сети и рекламная индустрия
Представьте потенциал автоматизации работы агентства и оперативной оптимизации рекламного текста и креативов для потребителей. Большие возможности здесь есть для мультимодальной генерации, которая сочетает рекламные тексты с дополнительными визуальными эффектами. На рынке уже можно найти сервис, агрегирующий все необходимые инструменты маркетинга в одном месте, например Creatosaurus.io.
Генерация кода
Текущие приложения стимулируют разработчиков и делают их намного более продуктивными: теперь GitHub Copilot генерирует почти 40% кода в проектах, в которых он установлен. Но еще большая возможность может заключаться в открытии доступа к кодированию для потребителей. Обучение подсказкам может стать лучшим языком программирования высокого уровня.
Генерация искусства
Весь мир истории искусства и поп-культуры теперь закодирован в этих больших моделях, что позволяет любому пользователю исследовать темы и стили, исходя из собственных предпочтений, на освоение которых ушла бы целая жизнь.
Дизайн сфера
Создание прототипов цифровых и физических продуктов — трудоемкий и повторяющийся процесс. Высокоточные рендеринги из грубых набросков и подсказок уже стали реальностью. Будьте готовы, что следующее приложение для iPhone или новая пара кроссовок будут разработаны машиной.
Игры
В краткосрочной перспективе ожидается использование моделей для создания сложных текстур и скайбоксов, или объектов в трехмерной графике.

В октябре 2022 года Sequoia Capital создала исходную карту рынка компаний и стартапов, занимающихся генеративным искусственным интеллектом.

<i>Источник: <a href="https://api.vc.ru/v2.8/redirect?to=http%3A%2F%2Fpic.twitter.com%2FdXyHR9dSvR&postId=621860" rel="nofollow noreferrer noopener" target="_blank">Gen AI Market Map by Sequoia</a></i>

— Дистрибуция рынка

Сегодня приложения для генеративного ИИ в основном существуют в виде плагинов в существующих программных экосистемах. Завершение кода происходит уже в ИСР, или Интегрированной среде разработки.

Боты Discord — это сосуд для внедрения генеративного ИИ в цифровые сообщества. Допустим, генерация изображений происходит в Figma или Photoshop. Существует также небольшое количество автономных веб-приложений Generative AI, таких как Jasper.ai и Copy.ai для копирайтинга, Runway для редактирования видео и Mem.ai для создания заметок.

Плагин может стать ключом для создания вашего собственного приложения и хитрым способом преодолеть проблему курицы и яйца с пользовательскими данными и качеством модели. С одной стороны, вы расширяете аудиторию. С другой, помогаете модели улучшаться за счет увеличивающегося количества пользовательских данных. Эта стратегия дистрибуции окупается в различных категориях рынка.

— Потенциал типов взаимодействия с ИИ

Сегодня большинство результатов генеративного ИИ являются «одноразовыми»: пользователь предлагает вводную информацию, машина выдает результат. По итогу, он либо останавливается на нем, либо пробует заново без сохранения исторических данных. Все чаще на рынке появляются более итеративные модели. С учетом предыдущих запросов ИИ позволяет изменять, объединять или повышать качество получившегося.

Результаты генеративного ИИ преимущественно используются в качестве прототипов или черновиков, которые будут полезны для дальнейшего доведения их до конечного состояния. По мере того, как модели становятся умнее, частично обучаясь за счет пользовательских данных, эти черновики будут становиться все лучше и лучше. Пока они не станут достаточно хороши для использования в качестве конечного продукта.

— Устойчивое лидерство в категории

Наиболее инновационные компании, занимающиеся генеративным ИИ, могут создать устойчивое конкурентное преимущество, неустанно работая на маховике между пользовательскими взаимодействиями и производительностью модели.

Чтобы победить, команды должны запустить этот маховик за счет:

вовлечения пользователей в использование модели
вовлечения пользователей в повышение ее производительности (оперативные улучшения, точная настройка модели, выбор пользователей в виде помеченных обучающих данных)
внедрения модели с отличной производительностью, чтобы стимулировать ее рост и интерес к ней

Скорее всего, генеративный ИИ займется конкретными проблемными областями (например, кодом, дизайном, играми), а не будут пытаться охватить все рынки и пользовательские сегменты. Сначала они будут глубоко интегрироваться в приложения, а затем попытаются заменить существующие обновленными ИИ рабочими процессами.

Для полноценных итеративных моделей еще далеко. Платформенный уровень только в процессе улучшения, а пространство приложений на данный момент почти не работает. Также есть множество упущений в области авторского права и безопасности, которые далеки от разрешения.

Сегодняшние модели достаточно хороши, чтобы писать черновики для блога, генерировать прототипы логотипов и интерфейсов продуктов, но в ближайшей перспективе мы ожидаем создания большей ценности для бизнесов и пользовательского опыта. Эта первая волна приложений генеративного ИИ напоминает эволюцию мобильных устройств, когда только вышел iPhone, несколько бесполезный, с нечеткой конкурентной дифференциацией и бизнес-моделями.

Однако именно этот период позволяет увидеть перспективы нового продукта. Как только вы увидите, как машина производит сложный функционирующий код или блестящие изображения, будет трудно представить себе будущее, в котором ИИ не будет играть фундаментальную роль в том, как мы работаем и творим.

Если мы позволим себе мечтать на несколько десятилетий вперед, то легко представить себе будущее, в котором Генеративный ИИ будет масштабно укоренен в нашу реальность.

заметки генерируются сами по себе
все, что вас окружает, создает 3D-печать
от чтения книги вы можете с легкостью перейти к просмотру фильма Pixar
а возможности в стиле Roblox позволяют вам реализовывать богатые игровые миры в режиме реального времени.

Хотя сегодня это может показаться научной фантастикой, темпы прогресса ИИ невероятно высоки — за несколько лет мы перешли от узких языковых моделей к автозаполнению кода — и если мы продолжим двигаться в том же темпе, то эти выдуманные сценарии могут войти в нашу реальность до того, как мы это осознаем.

Адаптированный перевод публикации.

Присоединяйтесь к нам в Telegram:

t.me

CyberBrain | digital marketing

#ии #искусственныйинтеллект #ai #artificalintelligence #чатgpt #gpt #gptchat #gpt3 #openai #midjourney #машинноеобучение #нейронныесети #нейронки #ai #sequoia_capital #sequoiacapital #sequoia