«Умные» колонки, ассистенты и чат-боты: как выглядит рынок разговорного ИИ в России

Обзор с детализацией по игрокам и оценками объёмов отрасли от управляющего директора Just AI Кирилла Петрова.

Кирилл Петров
Кирилл Петров

Чат-боты и искусственный интеллект для понимания естественного языка (NLU) — тема достаточно горячая. Несмотря на обилие статей и растущий интерес к этой области со стороны бизнеса, лично мне пока ещё не попадалось адекватных исследований или верхнеуровневых обзоров этого бизнеса в России, а большинство тех, которые я видел, — неполные или достаточно плохо структурированы.

Just AI, а ранее i-Free, работает в этом сегменте с 2011 года, и нам кажется, что мы хотя бы частично видим текущие тренды изнутри рынка и можем взять на себя смелость сделать его оценку, постараться классифицировать его участников и описать ключевые направления развития.

Текущая статья не претендует на полноту. Целью, скорее, хочется сделать правильное структурирование рынка и отрасли. Мы надеемся делать подобные обзоры регулярно и будем рады любой информации о новых игроках, проектах и объёмах рынка. Итак, кому нужен разговорный искусственный интеллект, и откуда на этом рынке деньги?

Есть несколько ключевых драйверов, обеспечивающих рыночный рост технологий NLU

1. Автоматизация контакт-центров

Контакт-центры для поддержки или маркетинговых коммуникаций с клиентами используют сотни тысяч компаний по всему миру. Это могут быть огромные корпорации — банки, телеком-сектор, ритейлеры. А могут быть и нишевые онлайн-сервисы, которые обслуживают своих клиентов через веб-чаты силами двух-трёх операторов, работающих дистанционно.

По оценке Everest Group, мировые расходы на контакт-центры оцениваются в $330 млрд в год, что в три раза больше, чем вся индустрия кино или, скажем, видеоигр. При этом сейчас, по статистике многих компаний, успешно внедривших технологии ИИ в саппорте, от 50% до 70% запросов пользователей можно решить без участия человека.

Очень часто это простые и частотные запросы, например, «ближайшие банкоматы», но могут быть и более сложные. В некоторых случаях ситуация может быть специфичной и требовать глубокого анализа, тогда ИИ передаёт управление обратно человеку — оператору контакт-центра, который (уже разгруженный от рутинных запросов) располагает временем для разбора сложного случая. Такая концепция называется AI+Human и широко распространена в ИИ-решениях для контакт-центров.

В результате достаточно очевидны выгоды и для бизнеса, и для потребителей. Бизнес экономит до 70% на пользовательской поддержке, а клиент без лишнего ожидания получает чёткий ответ на свой вопрос, либо внимательное человечное отношение в сложном случае. Важно также понимать, что речь зачастую идёт не только об автоматизации саппорта внешних клиентов компании, но и об оптимизации внутренних бизнес-процессов, например, в рамках HR-деятельности компании.

2. Появление умных устройств с интерфейсами на естественном языке

Этот процесс стартовал три года назад с появлением на рынке «умной» колонки (smart speaker) от компании Amazon — Amazon Echo. Устройство ставится в дом и активируется при произнесении ключевой фразы "Alexa" (имя виртуального ассистента от Amazon).

Echo умеет включать музыку по запросу, будить по утрам, управлять «умным» домом, зачитывать новости, осуществлять покупки, а также даёт доступ ко многим внешним сервисам, например, для вызова такси или заказа пиццы. Подобные сервисы у Amazon называются skills (в профессиональной среде прижилась калька с английского — скиллы), а исходные намерения пользователя — intents (по аналогии мы их называем интентами).

Колонка Amazon Echo стала первым по-настоящему массовым устройством на рынке США, во многом благодаря наличию качественного распознавания речи и умению услышать человека даже в шумной среде (благодаря встроенной матрице из шести микрофонов и специальным алгоритмам шумоподавления).

Amazon организовала целую экосистему скилов, дав возможность независимым разработчикам создавать собственные сервисы и делать их доступными через Alexa.

Так появилось множество решений для управления устройствами «умного» дома, заказа продуктов питания, бронирования столиков в ресторанах и тому подобного. Дотируя свои продукты и вкладывая ресурсы в маркетинг, Amazon, по словам Джеффа Безоса, продала «десятки миллионов устройств».

Аналитики считают, что к 2020 году компания продаст более 60 млн «умных» колонок. Цели Amazon понятны — стать основным устройством в доме у людей, центральным хабом, опосредующим намерения и желания человека.

Не случайно достаточно быстро на этот рынок вышла Google со своим устройством Google Home. На апрель 2017 года, по оценкам eMarketer, Amazon Echo контролировала 71% рынка «умных» колонок в США, следом шло Google Home с 24%, оставшиеся 6% приходились на остальных игроков.

При этом на Google I/O в мае 2018 года Google анонсировала появление целого ряда новых устройств от сторонних производителей, в которые встраивается Google Assistant.

В 2017 году битва за место под крышей в домах у людей развернулась и в Китае.

На рынок вышли Baidu с устройством Xiaoyu Zaijia (Little Fish), JD.com с устройством DingDong, Xiaomi с Mi AI Speaker. Летом вышла Alibaba со своей колонкой Tmall Genie и продала более 1 млн устройств в день распродаж. И, наконец, весной 2018 года к ним присоединилась Tencent c устройством TingTing. Отныне все гиганты интернет-рынка Китая имеют собственные «умные» колонки.

В 2018 году борьба за рынок умных колонок начнётся и в России. До конца весны единственным устройством, понимающим естественный язык на отечественном рынке, был детский робот Емеля от нашей компании Just AI, созданный в сотрудничестве с китайской компанией Roobo.

Он был запущен в июне 2017 года, а к концу весны мы продали около 7000 этих устройств. Однако мы ожидаем очень и очень скорого выхода на рынок российских компаний. А вслед за первыми из них к нам придут и китайские устройства.

Говоря об устройствах, понимающих естественный язык, важно отметить, что это далеко не только «умные» колонки. Домашние роботы, детские игрушки, устройства для автомобилей, «умная» бытовая техника — уже в 2018 году нас ждёт множество таких устройств. Только у себя в Just AI мы сейчас работаем над пятью подобными проектами.

«Умные» колонки станут новым каналом общения бизнеса с клиентами
«Умные» колонки станут новым каналом общения бизнеса с клиентами

3. Распространение интеллектуальных виртуальных ассистентов (IVA)

За «умными» устройствами и мобильными приложениями стоят интеллектуальные ассистенты, которые определяют базовые интенты пользователей и обеспечивают маршрутизацию и исполнение запросов клиента.

Наиболее известные из них — это Alexa от Amazon, Google Assistant от Google, Siri от Apple, Cortana от Microsoft и, наконец, русскоязычная «Алиса» от «Яндекса». Вопреки расхожему мнению, значительная часть скиллов реализуется вовсе не логикой собственных NLU-платформ компаний, оперирующих ассистентами.

Подавляющее большинство скиллов Google Assistant, Amazon Alexa — это сервисы, созданные внешними компаниями и работающие на сторонних платформах понимания естественного языка (их часто называют conversational или «диалоговые» платформы). В этом направлении движется и «Яндекс» в рамках «Яндекс.Диалогов». Он даёт компаниям возможность создавать (пока в бета-режиме) подобные скиллы (в терминах «Яндекса» — навыки).

Наша компания Just AI сейчас разрабатывает более десятка навыков «Алисы» для целого ряда известных российских и международных компаний. Алиса, вообще говоря, сильно отличается от многих своих иностранных предшественниц. Одним из её важнейших преимуществ является дружелюбие и наличие «характера».

Развитая «болталка», созданная в том числе и на основе технологий машинного обучения, — один из залогов успеха ассистента. С Алисой просто интересно поболтать, развлечься и поиграть, чего не сказать про большую часть конкурентов «Яндекса», сделавших ставку исключительно на скорость и утилитарность ассистентов.

В своё время, делая b2c-ассистентов в i-Free (Everfriends, «Собеседница») мы заметили, что именно эта часть (поболтать и развлечься) ассистента вызывает очень большой интерес, генерирует максимальный трафик и становится залогом возвращения людей.

Если говорить про цифры, то по оценкам компании Markets and Markets, рынок виртуальных ассистентов в 2016 году оценивался в $1,36 млрд, а в 2023 году он вырастет до $17,72 млрд.

При этом между ним и рынком устройств или автоматизации саппорта грань достаточно тонкая (уже сейчас устройство Google Home, обслуживая пользователей посредством Google Assistant, осуществляет в том числе переадресацию вызовов в контакт-центры компаний). В частности, основным драйвером роста рынка Markets and Markets считают именно автоматизацию клиентской поддержки.

4. Эволюция подхода к клиентскому сервису — омниканальность и интерактивные коммуникации с клиентами

Немного особняком, но всё же близко к технологиям NLU стоят решения для организации интерактивных маркетинговых коммуникаций с клиентами. С появлением мессенджеров SMS- и email-каналы стали стремительно устаревать из-за отсутствия полноценной интерактивности или ограниченности в возможностях по передаче контента.

С точки зрения бизнес-применений мессенджеров в коммуникациях, безусловным лидером сегодня является Китай. В мессенджере WeChat помимо месячной аудитории в 1 млрд пользователей зарегистрировано 14 млн бизнес-аккаунтов.

Это компании или предприниматели, общающиеся со своими клиентами через мессенджер. С учётом того, что у пользователей WeChat насчитывается более 300 млн электронных кошельков, эти коммуникации не ограничиваются простым информированием.

Боты в WeChat — это мини-сайты, в которых есть простая разметка, доступ целому ряду функций (например, геолокация, включение в зоне действия определенных WI-FI-сетей), важнейшей из которых является платёжная. В результате через WeChat можно осуществлять интегрированные интерактивные коммуникации с клиентами, соответствующие текущему контексту, и доводить клиента до покупки товара или услуги.

Похожие тренды прослеживаются и в других мессенджерах — и Telegram, и Facebook уже давно внедрили функциональность для кнопочных ботов, анонсировали планы по построению платёжных систем. Viber создал бизнес-аккаунты. WhatsApp создал бизнес-аккаунты для среднего и малого бизнеса и экспериментирует с крупным бизнесом в части интерактивных рассылок.

Современные коммуникации с пользователями выстраиваются там, где клиенту удобно говорить с бизнесом. Именно это и означает понятие омниканальности — среды коммуникаций, объединяющей разные каналы и единое управление ими.

И сегодня всё больше компаний предлагают подобные платформы, и некоторые из них в том числе реализуют функции кнопочных ботов и чат-ботов на основе семантики языка. И это достаточно значимый рынок с учётом того, что только SMS-коммуникации бизнеса с клиентами в России — это рынок в 20 млрд рублей в год.

Как выглядит рынок разговорного ИИ в России

Классификация рынка NLU и его участников — нетривиальная задача. На этом рынке очень много узкоспециализированных компаний, некоторые, наоборот, работают на более широком рынке, но без них структура отрасли будет неполной.

Например, создатели технологий ASR/TTS (распознавание и синтез речи). Строго говоря, потребность в их решениях шире, чем только использование в технологиях понимания естественного языка, но без них полноценные решения едва ли возможны.

Производителей «умных» колонок и других устройств тоже можно перечислить отдельно от рынка разговорного ИИ в целом. Есть ещё консалтинговые компании или интеграторы, перепродающие сторонние NLU решения.

Мы оценили и попробовали описать структуру отрасли. В ней, в основном, российские игроки. Но мы добавили и международные компании, которые ориентируются на Россию — у них есть готовые решения на нашем рынке, или их NLU-движки работают с русским языком. Оставили и значимых международных игроков, которые влияют на мировые тренды.

Отечественные и зарубежные платформы и сервисе на рынке разговорного ИИ
Отечественные и зарубежные платформы и сервисе на рынке разговорного ИИ

Объем рынка разговорного ИИ в России

Мы уже приводили оценки Markets and Markets, оценивающих рынок NLU ассистентов в $1,36 млрд и $17,72 млрд в 2023 году. Приведём нашу собственную оценку российского рынка и его динамику.

Just AI участвует более чем в 25 проектах внедрениях разговорного ИИ для российских банков, ритейлеров и компаний из других сегментов, в том числе разработчиков «умных» устройств. Мы с партнёрами ведём переговоры более чем с сотней потенциальных клиентов.

Процессы продаж, переговоров, тендеров и аукционов позволяют нам представить достаточно полную картину существующих игроков, их ценовых предложений и бизнес-моделей, а также динамику интереса и вовлечённости в эти проекты клиентов из разных отраслей бизнеса.

Именно на этой базе, а также на основе знаний о существовавших ранее проектах внедрения и основана наша оценка рынка. Мы будем рады её корректировать по мере появления новой информации.

Уже к концу 2018 года объём рынка в три раза превысит показатели 2016 года
Уже к концу 2018 года объём рынка в три раза превысит показатели 2016 года

Рынок сформировался в России в 2016-2017 годах, примерно тогда же начался бурный рост подобных проектов и в мире. До этого, по нашим оценкам, объёмы российского рынка разговорного ИИ составляли менее $2 млн в год. Но именно 2018 стал годом начала стремительного роста этого рынка в России.

С точки зрения клиентов — компаний, которые пользуются чат-ботами, ИИ и NLU-системами — мы видим следующую структуру и ожидаем следующую динамику на ближайшие три года:

Структура рынка по отраслям-потребителям технологий разговорного ИИ
Структура рынка по отраслям-потребителям технологий разговорного ИИ

Исторически именно телекоммуникационные компании, в частности, «Мегафон», «Билайн», МТС, стали одними из первых крупных корпоративных заказчиков и пользователей подобных систем.

Чуть позднее к ним присоединились банки («Сбербанк», «ЮниКредит Банк»). Многие из проектов 2016-2017 годов всё ещё в фазе «пилотного запуска», либо реализованы частично.

Отдельные компании, в частности, «Сбербанк», активно инвестируют в собственные разработки технологий ИИ. Наиболее высокий интерес к решениям в сфере NLU на корпоративном рынке мы видим со стороны банков, но ожидаем, что вслед за ними наибольшая динамика возникнет у компаний из сферы ритейла.

Источники

Исследования и обзоры:

Фото «умных» колонок взяты с сайтов Amazon, Lifewire, Engadget, Google Store.

2121
13 комментариев

Тут нет и намёка на искусственный интеллект, что за грязные маркетинговые уловки? Искусственному интелекту не нужно передавать управление мешку с костями, он сам должен всё решать, когда уже перестанут писать чушь? Кликбейтеры чёртовы, она заполонили vc.ru...

6

Алексей, ИИ современный - это большой набор различных задач автоматизации, за которые раньше браться было нерентабельно или технологически невозможно. А кейс, в котором ИИ должен понять, когда передать управление человеку, вообще крайне сложен. Это целая отдельная область науки.

5

Дальше "i-Free" можно было не читать. Как и ожидалось, в принципе.

2

Интересные факты, пишите еще

1

Спасибо. С удовольствием будем рассказывать о новых интересных событиях и аналитике.

1

Интересная статья сейчас пытаюсь разобраться более глубоко в этом направление.
В основном ориентируюсь на dialog flow от google и voxinplant
Также у последних есть бета проект smartcalls
Можете подсказать на что ещё стоит обратить внимание ?

Олег, спасибо за отзыв! Много зависит от языка, на который вы нацелены. Если русский - то вариантов меньше, DialogFlow - ок, посмотрите также нашу aimylogic.com. В дальнейшем мы планируем открыть доступ к нашей базовой платформе Just AI Conversational Platform, на наш взгляд, она лучше работает с русским, плюс, на ней можно писать более сложные вещи, но требует подготовки и обучения. Для английского вариантов больше - Microsoft Bot Framework и LUIS, Amazon Lex, визуальные конструкторы и другие платформы, которые есть в схеме выше. Про телефонию, кроме voximplant можно использовать тот же voxeo. Наша базовая платформа тоже с телефонией работает, но пока она открыта только для интеграций с корпоративными клиентами и ее нигде в Инете не потестить. Возможно еще вам покажется интересной сегодняшняя статья от нас на Хабре - там чуть больше про технику работы NLU платформ: https://habr.com/company/just_ai/blog/364149/

2