{"id":14268,"url":"\/distributions\/14268\/click?bit=1&hash=1e3309842e8b07895e75261917827295839cd5d4d57d48f0ca524f3f535a7946","title":"\u0420\u0430\u0437\u0440\u0435\u0448\u0430\u0442\u044c \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u0430\u043c \u0438\u0433\u0440\u0430\u0442\u044c \u043d\u0430 \u0440\u0430\u0431\u043e\u0447\u0435\u043c \u043c\u0435\u0441\u0442\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f71e1caf-7964-5525-98be-104bb436cb54"}

Илья Шиян

3 апр 2020 3.04.2020

«Ваш звонок очень важен для нас»: как мы создаем голосовых роботов для бизнеса

С голосовыми роботами вы наверняка сталкивались и в некоторых случаях даже не понимали, что с вами говорит не живой человек. Сегодня технологии позволяют создавать виртуальных голосовых операторов, которые разговаривают как человек, поддерживают диалог и обрабатывают ответы собеседника. Мы, компания Kvint, создали такого робота.

Голосовой робот и как его использовать

Голосовых роботов начинают внедрять, когда возникает потребность в обработке больших объемов звонков — от тысячи в день. С меньшим количеством обычно справляются своими силами. Если один оператор в день может обрабатывать 150-250 звонков, то у робота ограничений нет — он может обзванивать до нескольких миллионов людей. Компания выигрывает и в скорости обработки звонков, и в стоимости их обработки, сокращая затраты операторов в 2-4 раза.

Роботы интересны там, где много типовых звонков: это в первую очередь банки, операторы связи, коллекторские фирмы, крупные ритейлеры и так далее. Объем звонков в таких компаниях может доходить до сотен тысяч в день.

Роботов привлекают на разные задачи: холодные продажи, работа с должниками на разной стадии просрочки, опросы по качеству оказанных услуг, обработка звонков на первой линии. Виртуальный оператор может работать как самостоятельно, так и в паре с человеком. Тогда сначала робот обзванивает большую базу людей, потом отбирает из их числа «теплые контакты» (потребителей, заинтересованных в дополнительных услугах), а затем переводит их на оператора.

Как мы начали работу в этой сфере

Первый робот был создан в 2017 году для пиццерии с символичным названием «Счастье». Идея была в том, чтобы сделать универсального робота, который вместо человека принимал бы по телефону заказы для пиццерий, ресторанов и кафе. В России их огромное количество, более 50 тысяч, и нам казалось, что разработав одного робота, мы покроем узкий, но достаточно большой сегмент. Сделать голосового робота получилось: он действительно мог принимать заказы, помогал выбирать, например, с какой начинкой заказать пиццу, советовал напитки, даже мог распознавать разные блюда с незнакомыми названиями из японской и китайской кухни.

Однако идея с масштабированием провалилась. Причина была банальная: люди просто отказывались общаться с роботом, и постоянно просили переключить на оператора. Даже бесплатная пицца в качестве бонуса не могла их заставить заказывать через робота. Стало ясно, что там, где основным инструментом продажи является телефон, доверять роботу слишком опасно. Особенно это критично для небольших отдельных пиццерий, где количество заказов не превышает 100-150 в день — с этим легко справляются 1-2 оператора.

Тем не менее, первый неудачный опыт с пиццерией заложил основу для создания облачной платформы для проектирования голосовых роботов под разные задачи (и для любого сегмента бизнеса), а также заставил нас начать разработку своего синтеза речи, который максимальный был бы похож на человеческий голос. Задача была сделать робота, которого трудно отличить от живого человека.

Приоритетным было сделать такой инструмент, который позволил бы создавать голосовых виртуальных роботов без использования программистов-разработчиков. То есть чтобы любой аналитик или скриптолог мог самостоятельно делать роботов.

Зачем роботу быть похожим на человека

Сейчас распознать робота в виртуальном операторе Kvint практически невозможно — с этим справляется не более 1% пользователей. Голос — первое, на что человек обращает внимание в диалогах по телефону. Если робот сразу себя рассекретит неживым металлическим голосом, эффективность диалога снизится существенно, особенно это касается продающих скриптов.

В диалогах мы одновременно используем либо предзаписанные человеком фразы, либо их склейку с синтезированными вставками — в случаях, если в диалог требуется вводить переменные части (имена, суммы, даты, адреса). Поскольку мы разработали собственный синтез речи, то обе части фразы произносятся одним и тем же голосом. Так получается относительно бесшовная склейка.

Однако в нашей практике были исключения, когда мы наоборот меняли живой человеческий голос на полностью синтезированный и металлический — это было с роботом для вызова врача на дом, который принимал звонки от пациентов. Робот фиксировал основные данные по вызову: ФИО пациента, симптомы, адрес, контактную информацию. Если люди, особенно пожилые, думали, что говорят с человеком, то иногда начинали долго перечислять весь анамнез болезни, или рассказывать, как сходили на день рождения к подруге, после чего у них случилось расстройство… Роботу было сложно адекватно реагировать подобных диалогах — он начинал переспрашивать или отвечать невпопад. Поэтому намеренно мы поменяли голос на искусственный, и люди стали более четко и коротко отвечать на вопросы виртуального медицинского оператора, понимая, что перед ними не человек.

Сегодня преимущество голосового робота Kvint в том, что с ним можно разговаривать достаточно в естественной свободной манере — он понимает не только отдельные ключевые слова, выдергивая их из контекста, но также может анализировать смысл целых фраз и предложений. Человеку не приходится подстраиваться, когда ему намеренно задают закрытые вопросы, на которые можно ответить только «да» или «нет».

Как мы работаем сейчас?

За несколько лет работы мы создали облачную платформу, которая позволяет создавать голосовых роботов без участия разработчиков-программистов. Сегодня это комплекс взаимосвязанных систем:

система распознавания речи собеседника, преобразующая аудиопоток в текст;
система синтеза речи, которая позволяет роботу заговорить на естественном человеческом языке;
модуль, отвечающий за бизнес-логику ведения диалога;
система, определяющая смысл сказанного человеком;
встроенный модуль ip-телефонии, позволяющий голосовому роботу подключаться к внешней телефонии клиента;
визуальный графический редактор, позволяющий быстро и наглядно проектировать голосовых роботов.

Мы уже адаптировали платформу для создания виртуальных голосовых операторов не только на русском языке, но и на других европейских языках — английском, немецком, французском. Европейские и западные рынки — достаточно привлекательный сегмент для подобных технологий. По объему они в разы превышают российский рынок, и по маржинальности в некоторых странах более привлекательны.

Сегодня среди наших клиентов есть банки, крупные интернет-магазины, поликлиники. С некоторыми крупными компаниями запущены пилотные проекты, в частности — ВТБ, МТС, Росбанк, Мегафон.

Развитость рынка влияет на интерес к технологии, сегодня идет бум спроса на подобные услуги. Это связано с общим трендами цифровизации и автоматизации всех бизнес-процессов. И голосовые технологии, искусственный интеллект в этом сегменте — одно из наиболее перспективных направлений как для потребителей, так для бизнеса и инвесторов.

11 показов

6.4K открытий

1 комментарий

Дмитрий Прозоров

3.04.2020

Для отлупа таких роботов у меня подключен автоответчик Олег:
Звонит такой робот, ему отвечает робот Олег, минуту тупят, сценарии ломаются и подключается настоящий оператор.

Надеюсь, такие автоответчики появятся на всех операторах и телефонного спама станет меньше.

Ответить

Развернуть ветку

Написать комментарий...

-2 комментариев

Раскрывать всегда