Технологии будущего: колл-центр без людей, зато с Dialogflow

Конспект лекции сооснователя и генерального директора компании Voximplant Алексея Айларова на специальной версии ежегодной конференции о коммуникациях для бизнеса Intercom E-com. В конце статьи есть видео и ссылка на демо.

Автоматизация повседневных задач вроде заказа еды — наше недалекое будущее, которое становится все ближе благодаря компаниям Google, Amazon и Baidu, активно инвестирующим в machine learning и искусственный интеллект.

Телефон — основной канал продаж

Несмотря на развитие технологий, телефон все еще остается самым востребованным каналом связи, и в определенных случаях он может генерировать до 80% выручки.

Интернет-магазин и сайт компании можно рассматривать как витрину: если речь идет про сервис или сложный продукт, люди все равно звонят, спрашивают и уточняют интересующие их моменты. Им нужно получать ответы на общие и специфические вопросы, прежде чем они будут готовы расстаться со своими деньгами.

Параллельно есть статистика, подтверждающая, что большинство людей хочет, чтобы их обслужили быстро: 77% покупателей готовы ждать ответа оператора не более 25 секунд. В идеале клиенты хотят, чтобы им ответил живой человек в течение 10-15 секунд и решил их вопрос.

Колл-центр — недешевое удовольствие

Большой штат сотрудников требует от бизнеса ощутимых затрат. Когда приходит время оптимизации расходов, компании начинают экономить прежде всего на обслуживающем персонале: секретари, сотрудники колл-центов, линейные менеджеры.

Этот «достаточно хороший» способ экономии приводит к тому, что клиентам приходится ждать ответа оператора в лучшем случае несколько минут. Для бизнеса подобное ожидание чаще всего заканчивается потерей клиента.

Пришла пора автоматизации

Автоматизация работы колл-центра — тренд, который появился давно. Прежде всего, Сотрудники КЦ занимаются обслуживанием клиентов, когда те хотят что-то купить: нужно ответить на базовые вопросы, помочь оформить заказ, проверить введенную информацию. Плюс существует часть вопросов, связанная с поддержкой: про доставку, про оплату, про то, что что-то пошло не так. Все как и везде, есть два основных блока: продажи и поддержка. И одно без другого не существует.

Шаг первый — интеграция с CRM

В современном мире человек привязан к номеру телефона: мы все пользуемся мессенджерами, социальными сетями, по номеру телефона нас идентифицируют в приложениях, на сайтах и, например, на портале Госуслуг, к телефону также привязываются карты лояльности. Мы перестаем пользоваться городскими номерами — если я звоню с телефона, то с высокой долей вероятности я буду звонить со своего мобильного номера.

Если я что-то заказывал в интернет-магазине, то, скорее всего, я уже есть у вас в CRM, и вы можете посмотреть историю моих заказов и общения со мной. Если я новый клиент, создается и заполняется новая карточка в системе работы с клиентами и заполняется карточка. Эту работу можно назвать первым шагом в процессе автоматизации.

Шаг второй — «умный» IVR

«Умный» IVR умеет общаться с клиентами без участия человека, используя синтез речи или записанные фразы. Если клиент что-то купил или заказал, его заказ появляется в CRM. При входящем звонке поднимается карточка клиента, делается предположение, что, вероятнее всего, у звонящего есть вопрос про доставку этого товара.

Клиента можно спросить «да» или «нет»; если «да», можно проинформировать, что доставка будет послезавтра, в 5 часов вечера. Если это была вся информация, которую хотел уточнить клиент, он положит трубку; если же ему хочется задать вопрос, всегда можно попросить перевести на живого человека, чтобы, например, отменить или скорректировать заказ.

Шаг третий — ML/ИИ/NLP

Тренд, который сейчас набирает обороты, — это возможность «общаться» с клиентом не просто по заданным шаблонам и меню, а разговаривать «свободно», на естественном языке, но в автоматическом режиме. Мы формируем запросы миллионом разных способов, и IVR должен быть к этому готов. «Подготовить» робота можно, используя новые технологии, такие как machine learning, искусственный интеллект и NLP.

Пришла пора роботизации

«Типовых» задач существует множество, каждый бизнес может проанализировать работу своего колл-центра, прослушать диалоги и выделить базу, которую можно автоматизировать, загрузив робота. Естественно, что-то останется на людях: специфика бизнеса, сложные запросы, особые клиенты, которых не понимает распознавание, — всегда есть возможность переключиться на человека, используя его время эффективно.

Благодаря современным технологиям автоматизации любая компания может существенно уменьшить издержки на обучение, зарплату, отпуска и больничные — робот обучается один раз, он не уволится и не уйдет в другую компанию, его всегда можно дообучать. Робот будет работать до тех пор, пока компания платит за его ресурсы: среди них синтез, распознавание, вычислительные ресурсы.

Понимая запросы рынка, ИТ-корпорации объединяют наиболее востребованные технологии в единый стек, который позволяет довести IVR до уровня, когда вы будете с трудом отличать его от живого человека.

Первая часть этого стека — это синтез речи с новыми технологиями типа WaveNet от Google, который звучит как живой человек. Нужно очень постараться, чтобы понять, что с вами говорит робот. Есть и интонации, и паузы, встречаются моменты, связанные с дыханием, — технология «натренирована» на разговорах живых людей.

И это совершенно другой подход: раньше был вокодер, который аналогично тренировали, обучали, записывали фразы, но логика его работы была другой, и он звучал как «железная женщина».

В пример можно привести недавнюю демонстрацию с Google I/O, на которой робот звонил в парикмахерскую, чтобы записаться на стрижку: человек в парикмахерской не понимал, что с ним говорит робот. Грань между «железом» и живым оператором размывается, узнать о том, что вы разговариваете с роботом, можно, только если сценарий пойдет по непредсказуемой ветке, что бывает редко.

Вторая часть — распознавание речи, которое также не первый год переживает активное развитие и подъем, постоянно совершенствуется. Раньше мы могли только мечтать, чтобы понимать какие-то отдельные команды, например, «да», «нет», «хочу», «не хочу», «дайте мне это». Сейчас есть возможность распознавать обычную человеческую речь.

Процент ошибок пока что высок, но со временем он будет понижаться, и в какой-то момент автоматическое распознавание речи будет не сильно отличаться от того уровня, который мы можем слышать как люди, понимать и осознавать. В каких-то случаях распознавание, возможно, даже будет превышать наши ожидания.

И третья часть стека — понимание «живой» человеческой речи, выделение смысла запроса и обучение на примерах. В пример можно привести «Яндекс.Навигатор», который понимает адреса, в произношении которых мы сами не всегда уверены.

Водители из разных стран СНГ возят нас, у каждого водителя есть свой акцент. Иногда они специфично произносят адрес, и мы думаем, что навигатор распознает его неправильно. Но нет, распознавание происходит корректно — это и есть машинное обучение, благодаря которому система уже может понять то, что обычный человек воспринимает с трудом.

Сейчас мы не можем быть уверены на 100% в том, что в разговоре не понадобится живой оператор. Но мы точно уверены в том, что есть «простые» задачи, например, заказ пиццы, где все достаточно стандартизировано — на эту «первую линию» мы как раз можем поставить робота, оставив нестандартные ситуации для операторов.

О Google Dialogflow

Google Dialogflow – это сервис, который возник в результате поглощения компанией Google API.ai, которые делали изначально Speaktoit; когда Google начал заниматься своим ассистентом, компания решила, что эта технология ей близка и интересна. В итоге Google купила API.ai, сделав на её основе Dialogflow. Отмечу, что API.ai — компания с русскими корнями.

Смысл Dialogflow в том, чтобы нести в массы машинное обучение и дать обычным людям возможность тренировать «машину», которая понимает естественную речь, выделяет из нее интенты, может делать так называемый slot filling (это когда мы называем несколько параметров, машина их классифицирует и может запросить недостающую информацию), к которому сводится значительная часть общения. Мы говорим роботу информацию, он получает данные, систематизирует и отвечает на их основе.

Сейчас Dialogflow поддерживает 18 языков, плюс есть возможности по интеграции с внешними сервисами через API, используя которые можно добиться нужного вам результата по автоматизации.

Встроенный machine learning легко обучается на имеющихся примерах: можно выгрузить записи разговоров из колл-центра, проанализировать, загрузить в робота тексты, разметить — через какое-то время, обучившись, робот начнет понимать запросы, которые ему уже показали. Это и есть специальная «магия», в результате которой робот понимает не только прямые запросы, но и аналогичные.

Например, если я загружу запросы «Хочу авиабилеты из Москвы в Питер на послезавтра, в 5 часов вечера» и «Я хочу из Сан-Франциско в Лондон 30 июня, утром» и размечу их, а потом спрошу про другие города и другие даты, робот уже корректно обработает этот запрос и выдаст результаты, поняв о чем идет речь.

Голосовой бот для пиццерии

Самый простой способ продемонстрировать, как может выглядеть интеллектуальный IVR – показать пример из реальной жизни:

Пример голосового бота, созданного с использованием Dialogflow и Voximplant

Мой разговор с роботом длится чуть менее 1,5 минут. Себестоимость обработки сделанного заказа менее 4 рублей при текущем курсе доллара. Цена складывается из времени, которое потребляют перечисленные технологии. Минута разговора с оператором колл-центра при аутсорсе в среднем стоит в районе 9-10 рублей. Выгоду каждый может посчитать сам, опираясь на свой бизнес.

Это реальный бот, на номер которого можно позвонить и пообщаться. Я заранее мог бы бы сказать ему адрес, время и собрать заказ по-другому, но благодаря «заполнению слотов» робот все равно бы «понял» мой заказ, корректно заполнив карточку заказа.

Коллеги из индустрии комментируют, что «нормальный продавец предложил бы напитки и соусы, сделав дополнительную продажу». Все это тоже можно реализовать: это всего лишь дополнительные данные, которые можно добавить к карточке заказа. Не получив данные, в конце разговора робот легко сможет уточнить про напитки, соусы, экспресс-доставку за отдельную плату и количество приборов.

Протестировать бота можно, перейдя по ссылке: введите свой номер телефона в международном формате, нажмите кнопку «Далее», с указанного номера наберите +74999384952 — это позволит смотреть, как бот в режиме реального времени формирует конкретно ваш заказ.

Хозяйке на заметку

Одного Dialogflow недостаточно для создания телефонного бота, нужна специальная связка с телефонией, для которой я использовал Voximplant и его новую функцию Dialogflow Connector, позволяющую подключить любой звонок к Dialogflow-агенту максимально быстро и просто.

В примере использовался синтез от «Яндекса», а не WaveNet, так как в последнем поддерживается только английский язык. В течение года Google обещает подключить к Dialogflow другие языки WaveNet-синтеза — я думаю, что этот же пример на другой технологии в конце года будет звучать по-другому и нам будет действительно сложно отличить робота от человека.

0
30 комментариев
Написать комментарий...
Отари М

А сколько это стоит? Примерно

Ответить
Развернуть ветку
Voximplant
Автор

Итоговая цена складывается из времени, которое потребляют перечисленные в статье технологии. Себестоимость обработки заказа, приведенного в примере, менее 4 рублей при текущем курсе доллара. Для сравнения: минута разговора с оператором колл-центра при аутсорсе в среднем стоит в районе 9-10 рублей.

Ответить
Развернуть ветку
Виктор Н. (FractalGPT)

Как делаете разметку данных под разные бизнес-кейсы? Как собираетесь развивать продукт, вам ведь потребуется дополнительная работа, чтобы внедрить в робота функционал допродаж, отработки возражений, понимание нетипичных вопросов, небезопасных вопросов (порно, угрозы и тп).

Мы в GraphGrailAi делаем ИИ платформу на блокчейн, которая помогает обучать нейросети, делать ИИ приложения понимающие запросы и затем подключать их в ваши сервисы. В том числе и сырые данные можно у нас превратить в обогащенные, чтобы нейросети обучать

Ответить
Развернуть ветку
Grigory Petrov

Мы занимаемся телеком-облаком, которое делает две основные вещи: принимает звонки и звонит. Сотовые телефоны, веб страницы (с нашим SDK), Android и iOS (тоже с нашим SDK), голос, видео, мессаджинг. Ключевое - это JavaScript, которые пишут наши клиенты и который выполняется нашим облаком в реальном времени. Именно он позволяет задавать любую логику и именно в нем реализована интеграция с DialogFlow. Так что нам самим не нужно делать разметку: клиент регистрируется на voximplant.com, пишет JavaScript код для управления звонком, загружает в DialogFlow данные, размечает - и на выходе получает свое уникальное решение. Для развития которого ему совершенно не нужна какая-либо наша помощь. Комбинация JavaScript в нашем облаке и обученного DialogFlow позволяет обработать практически любой кейс.

Ответить
Развернуть ветку
Отари М

Менее 4х рублей всего или за минуту?

Ответить
Развернуть ветку
Voximplant
Автор

Всего, разговор в примере длится примерно 1 минуту 20 секунд.

Ответить
Развернуть ветку
Anton Matrosov

Лайк за Dialogflow, тоже работаю на этом фреймворке, немало проектов на нем сделал

Ответить
Развернуть ветку
Timm Shrago

Пожалуйста, напишите мне в FB

Ответить
Развернуть ветку
Лена Гунько

Добрый день, напишите в фб, пожалуйста

Ответить
Развернуть ветку
stivstivsti

Постановка, как у гугл?

Ответить
Развернуть ветку
Grigory Petrov

Что интересно, нет! Я как раз проходил рядом с нашей зеленой переговоркой, когда из нее выбежал радостный Леша с криками "С первого раза записалось!"

Ответить
Развернуть ветку
Elena Stolbova

«Подтасовывать» результаты чаще сложнее, чем просто сделать хорошо :)

Можно позвонить, пообщаться:
http://demos05.voximplant.com/pizza/

Ответить
Развернуть ветку
stivstivsti

Позвонил, спросил "у вас есть салат цезарь?" -- система не смогла меня понять. Не взлетит имхо.

Ответить
Развернуть ветку
Alexey Aylarov

Это технодемо, сделать так чтобы бот понял про салат цезарь несложно, но задачи в этом демо такой не стояло. Ваш инпут записался в бота и можно сделать его обработку примерно за 1 минуту, в этом и есть смысл Dialogflow

Ответить
Развернуть ветку
stivstivsti

сделайте

Ответить
Развернуть ветку
Sergey Gostev

Что-то меня тошнит от такого будущего. Такое чувство что разговариваешь с не адекватным человеком. Да голос человеческий, но говорит как робот. Жуть

Ответить
Развернуть ветку
Grigory Petrov

Это называется "зловащая долина", забавный психологический феномен. От компьютеров раньше тоже тошнило. Несколько лет развития технологий - и норм будет!

Ответить
Развернуть ветку
Voximplant
Автор

Себестоимость обработки заказа, приведенного в примере, менее 4 рублей при текущем курсе доллара. Итоговая цена складывается из времени, которое потребляют перечисленные в статье технологии. Для сравнения: минута разговора с оператором колл-центра при аутсорсе в среднем стоит в районе 9-10 рублей.

Ответить
Развернуть ветку
Кирилл Шнуров

Очень круто. Увы, но себестоимость обработки своим колл-центром тоже в районе 4 рублей, смысла внедрять нет.

Ответить
Развернуть ветку
Alexey Aylarov

Даже если стоимость сопоставима, то смысл внедрять все равно есть. Масштабируемость (сколько надо операторов столько и будет когда необходимо), отсутствие проблем с наймом (один раз бота хорошо обучил и дальше только дообучай), 24/7/365 и много других преимуществ.

Ответить
Развернуть ветку
Кирилл Шнуров

Здесь будут куда более серьезные проблемы с масштабированием и наймом - инженеров, которые способны это внедрить, поддерживать и развивать. Один такой стоит как 10-20 операторов колл-центра.

Плюс резервирование этой технологии в принципе невозможно, у Гугла упало или еще какой роскомнадзор случился - нет колл-центра.

Ответить
Развернуть ветку
Grigory Petrov

И вот тут мы переходим к интересному: Voximplant как раз известен тем, что платформа сделана для веб разработчиков. То есть обычный веб разработчик, который делает сайт компании и знает миниуму JavaScript, сможет сделать и всю автоматизацию телефонии! За последние пять лет многократно проверено на людях.

Ответить
Развернуть ветку
Anton Cheshkov

Тогда и минусы перечислите

Ответить
Развернуть ветку
Grigory Petrov

Главный минус - нужен JavaScript разработчик в штате, чтобы написать эти двадцать строк кода. Нет "кампутарщикав" - нет автоматики :)

Ответить
Развернуть ветку
Антон Даутов

Я задал вопрос "какие виды пиц есть" робот не понимает. Так се короче.

Ответить
Развернуть ветку
Alexey Aylarov

Это просто демо. Теперь понимает, кстати - дообучать Dialogflow легко.

Ответить
Развернуть ветку
Николай Шмырев

Тем временем в долине трут, что чатботы не работают, эмоциональной составляющей недостаточно для продаж: https://blog.growthbot.org/chatbots-were-the-next-big-thing-what-happened

https://www.youtube.com/watch?v=ssm53tCiuno

Ответить
Развернуть ветку
Grigory Petrov

Чатботы - да. Голосовые боты - нет. Удобство перевешивает "эмоциональную составляющую" :)

Ответить
Развернуть ветку
Nikita Maskva

У группы Тинькофф есть услуга облачный колл центр.

Предоставляют свои мощности и компетенции для работы по вашей базе. Холодная теплая, рабочая.
Ставишь цель-готовятся сценарии и вперед.

Говорят про 5₽ минута.

Общение с живым человеком.

Ответить
Развернуть ветку
Elena Stolbova

Все верно: за двухминутный разговор, о котором идет речь в примере, в итоге получается порядка 10 рублей. Роботы все равно дешевле.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
27 комментариев
Раскрывать всегда