Что такое голосовой бот и зачем он нужен бизнесу

Рассказываю, что такое голосовой бот, для каких задач он подходит, как работает, чем полезен бизнесу и сколько стоит его разработка.

Голосовой бот — это оператор с искусственным интеллектом (AI), который совершает и принимает звонки, а разговор ведёт по продуманному сценарию. За счёт технологий AI робот способен понимать фразы, которые люди используют в живом общении. А также отвечать им реалистичным синтезированным голосом.

Станислав Грибанов Solution Owner в Just AI, компания — один из лидеров рынка разговорных решений для бизнеса. В подкасте Just AI «CONVERSATIONS WITH» Станислав ответил на вопрос: «Зачем бизнес внедряет телефонных ботов?»

«Самая банальная причина — это экономичность.Текущие технологии позволяют в большинстве рутинных сценариев телефонного разговора полностью заменить оператора и, как мы уже заметили на своих проектах, часто добиваться показателей выше, чем у оператора. A/B-тесты и возможность понимать, как пользователи реагируют на фиксированную модель диалога, позволяют построить сценарий максимально эффективно и конверсионно. С операторами такого не получается, так как они практически всегда отклоняются от скрипта».

Второй причиной эксперт называет масштабируемость AI-контакт-центра в конкретном моменте. Если произойдёт всплеск звонков, можно нарастить мощность системы и обработать большое количество обращений.

Кому подходят голосовые боты

Бот способен обрабатывать более тысячи звонков и одновременно вести разговор с сотнями клиентов. Робот возьмёт на себя задачи оператора первой линии поддержки и продаж.

На входящих звонках робот консультирует клиентов по типовым вопросам, а сложные задачи направляет менеджерам в соответствующий отдел.

Исходящие телефония — это сервисные звонки, где что-то подтверждается или согласуется. Например, бот для салона красоты запишет клиента к мастеру, напомнит о визите или перенесёт его при необходимости.

К исходящим звонкам относятся продажи и лидогенерация. Бот может рассказать клиентам о специальном предложении, собрать обратную связь, а тех, кто заинтересовался, перевести на оператора. Ещё он способен снять возражения клиента и убедить приобрести товар или опробовать услугу.

Разговорные роботы лучше всего себя проявляют в компаниях, ориентированных на клиентов. Среди них: службы такси и доставки, фитнес-центры, салоны красоты, интернет-магазины, страховые компании, банковские организации, медицинские центры и Event-компании.

Как работает голосовой бот

Как бот понимает человека

Как происходит диалог с голосовым ботом? Робот отталкивается от реплики человека и активирует соответствующий сценарий разговора. Важно, насколько точно бот интерпретирует речь собеседника.

Боты без поддержки AI определяют только простые фразы, ответы типа «да» и «нет», или реагируют на нажатие клавиш телефона. Они не справляются со сложными запросами и не заметят перебивания. В их работе нет гибкости, и поэтому они теряют актуальность.

Боты с AI используют систему NLU (Natural Language Understanding, или понимание естественного языка): она позволяет извлекать смысл из сообщений и тем самым понимать, что хочет клиент.

Бота с NLU можно обучить на примерах реальных фраз, которые люди используют во время общения. К примеру, бот поймёт, что клиент хочет вернуть товар, по запросам «заберите», «верните деньги», «компенсируйте стоимость». Если такая фраза окажется внутри длинной реплики, бот всё равно её обнаружит. Такой робот способен понимать названия продуктов или редкие термины, а по необходимости его можно дообучать, расширяя «словарный» запас.

Вообще, в основе NLU лежат нейросети — это алгоритм искусственного интеллекта. Алгоритм автоматически обрабатывает данные, обучаясь находить в них закономерности, и в результате решает поставленную перед ним задачу. Нейросети могут генерировать текст, в том числе и коммерческий — например, заголовки для статей или краткие описания товаров. Более подробно я рассказывал об этом в предыдущей статье.

Эффективный сценарий диалога для бота

Эффективность бота зависит от сценария, по которому идёт диалог с пользователем.

Хороший сценарий помогает клиенту решить его задачу и имеет ответы на вопросы, которые могут появиться в ходе разговора.

Сложный сценарий может включать десятки вариантов развития диалога. Ниже схема разветвлений диалога в большой сети фитнес-клубов.

<p>Источник: https://robo-voice.ru/all-about-voice-bots/</p>

Источник: https://robo-voice.ru/all-about-voice-bots/

Ещё один важный момент: сценарий должен быть таким, чтобы человек не понял, что он разговаривает с ботом.

Екатерина Быстрова, лидер команды развития продаж AI-роботов в МегаФоне, в подкасте Just AI отметила, что психологически люди пока не готовы общаться с роботами.

«Пользователи привыкли, что на входящей линии практически во всех крупных организациях используются роботы, так как там большой поток информации. Но когда мы говорим про исходящую линию, то там абоненты не должны чувствовать, что с ними разговаривает машина».

Эксперт считает, чтобы достичь естественности в разговоре, робот должен действовать следующим образом:

  • ошибка, когда человеку не дают поздороваться в начале и сразу же озвучивают длинный оффер;
  • пользователя не нужно перегружать лишней информацией, предложение должно быть лаконичным и ценностным;
  • если человек говорит долго или подробно уточняет детали, бот может понять только часть сообщения. Поэтому в сценарии надо прописать вариант действий, при котором робот переспрашивает или задаёт закрытый вопрос;
  • в случае когда вопрос от человека повторяется, боту следует отвечать разными фразами.

Разработка диалога для входящей и исходящей телефонии также отличается.

Участник подкаста Денис Балюра, основатель платформы Tomoru, считает, что различие в том, у кого находится инициатива в разговоре.

«Когда звонит робот, в 100 из 100 разговоров инициатива всегда находится у него, даже если человек возражает, уточняет, робот всё равно подталкивает его к цели. Когда звонит человек, робот на старте не знает его задачу, а он может позвонить с большим перечнем вопросов. Ведь роботу отдела продаж могут позвонить по вопросу поддержки, например. Это уже добавляет вариативности».

Денис отмечает и другой важный момент в работе бота:

«Если у робота спросили: “Вы робот?”, — он должен признаться. Потому что, если у человека есть сомнения, он начнёт пытаться сломать бота специально».

Также сценарий должен предвидеть вариант, когда бот не справляется с задачей пользователей. В этом случае человека надо переводить на оператора.

Распознавание речи

Чтобы вести разговор с человеком, боту необходимо распознать его речь и перевести её в текст. Это осуществляется с помощью технологии STT (speech to text), которая работает за счёт нейросетей.

Чтобы расшифровать голосовую запись, нейросеть разбивает её на фонемы, а затем составляет из них слова. Для этого алгоритм обучают на базе из тысячи вариантов произношения слов и букв. Алгоритм можно также обучить распознавать термины из определённой сферы деятельности.

Ведущие поставщики технологий применяют разные методы, чтобы повысить точность распознавания.

В распознавании Yandex SpeechKit участвуют языковые модели. Слово можно распознать по-разному, и чтобы выяснить, что именно человек произнёс, для слова выстраиваются гипотезы. Модель соотносит их с другими словами из речи, учитывает контекст и отбирает лучший вариант.

В технологии сбера SmartSpeech помимо проверки гипотез, применяют хинты — одноразовые подсказки, которые помогают понять собеседника в конкретный момент его речи. Один из видов хинтов усиляет распознавание слов или фраз, которые используются чаще всего.

Сбер научил нейросети выявлять шум, посторонние звуки и в процессе распознавания игнорировать их. Ещё их технология определяет эмоции говорящего, это подскажет, когда перевести клиента на оператора или затем проверить разговор, где человек оказался недоволен.

В целом, нейросети позволяют распознавать речь с точностью в 95% (у человека 96-98%). Однако на точность может влиять качество записи и внятность речи.

Озвучка бота

Один из вариантов озвучить бота — подготовить предзапись с диктором. Это подойдёт, когда у робота небольшой сценарий и он общается шаблонными фразами. К озвучке лучше привлечь непрофессиональных дикторов или добавлять естественные реакции, которые присутствуют в речи обычного человека. Это междометия, замедления «подождите секундочку» и т.п. Например, в боте для обзвонов «Додо Пиццы» реплики озвучивает реальный сотрудник компании.

Однако в разговоре часто присутствуют переменные — постоянно меняющиеся данные: Ф. И. О. клиента, номер посылки, адрес доставки и т. д. Подобных комбинаций — тысячи, и проработать их всё с диктором крайне трудно. К тому же отсутствие персонализации в диалоге может отрицательно повлиять на конверсию.

С этим справляется синтез речи (text to speech, TTS) — технология в реальном времени озвучивает любой порядок слов. В результате записанные фразы диктора склеивают с синтезом переменных. Проблема в том, что синтезированный голос подбирают на слух, он может выделяться на фоне голоса диктора и звучать менее естественно. Данную проблему решает гибридный синтез. При этой технологии синтез станет идентичен голосу диктора, и вся фраза будет звучать цельно и органично. Такие решения есть у Just AI и Yandex SpeechKit.

Другой вариант — полностью синтезированная речь. Он подойдёт, когда у бота масштабный и вариативный сценарий, если сценарий будет часто меняться или будут добавляться новые части. Или бот не имеет готовых ответов и генерирует новые в произвольных диалогах. Например, так может голосовой помощник Алиса. Такое решение позволяет сэкономить затраты на запись фраз диктором.

Станислав Грибанов подчёркивает:

«Синтез сегодня должен звучать максимально похоже на человека, должна быть возможность обучить его с помощью алгоритмов machine learning говорить лучше по определённой тематике и замечать ударения».

Готовые голоса с качественным синтезом предлагают Just AI, SmartSpeech, Yandex Speechkit и Tinkoff VoiceKit. Также эти компании дают возможность создать синтез на основе вашего голоса. Однако такое решение дорогое, оно требует специалистов и оборудование, а на реализацию уйдёт до полугода.

В целом, для входящих звонков, когда решается потребность клиента, подойдёт синтез, но с естественным звучанием, близкий к человеческому голосу. Для исходящей связи оптимальное решение — склейка: запись и синтез переменных. Так вы получаете уникальный голос бренда и незаметный переход на синтез, если выберете качественную технологию склейки.

Функции голосовых ботов

Разные инструменты позволяют повысить функциональность бота за счёт автоматизации различных бизнес-процессов.

Логика работы бота прописывается на языке программирования, и при необходимости порядок его действий можно усложнить. Вносить изменения можно в визуальных конструкторах, в которых разрабатываются боты, они рассчитаны на обычных пользователей.

Один из таких конструкторов — Aimylogic от Just AI. Он позволяет усложнить сценарий с помощью добавления Javascript. Можно сделать так, что значение переменной, важной для бота, будет зависеть от разных обстоятельств. Это может быть бот отеля, который изучает брони и сразу сообщает клиенту, какие номера свободны.

Если роботу необходимо что-то быстро посчитать, применяются вебхуки. Они посылают данные на внешний сервер, где расчёт происходит в реальном времени. Допустим, бот считает стоимость ремонта, цена будет зависеть от помещения, отделки, сроков и других факторов.

Бота подключают к CRM-системе — это база данных, где он берёт информацию о клиентах и вносит новую, которую получает в ходе разговора. Например, голосовой бот интернет-магазина Flowwow, используя CRM, по номеру телефона определяет профиль звонящего. В зависимости от того, партнёр это, клиент с оформленным заказом или нет, бот озвучит определённую информацию. А при соединении с оператором ему заранее сообщается номер заказа и цель звонка. По итогу время обслуживания клиентов заметно сокращается.

Также бот может транскрибировать звонок в текстовую запись, сохранить историю звонков и вносить их в CRM или другую базу данных.

Преимущества и эффективность ботов

Бот полностью исключает человеческий фактор, который влияет на результативность звонка.

Во-первых, он работает круглосуточно, всегда онлайн и готов принимать обращения клиентов.

Во-вторых, бот не допускает ошибок. Он строго следует скрипту разговора, не пропустит ни одного звонка, не забудет позвонить и записать данные о клиенте.

В-третьих, робот не подвержен стрессу. Неизменно вежлив и не меняет интонацию голоса из-за усталости.

Другие плюсы — это скорость и экономичность по сравнению с живыми операторами.

По подсчётам Robovoice, бот обработает 1000 звонков за 90 минут, колл-центру для этого потребуется 50 операторов. При этом минута разговора у робота в среднем стоит 5-7 рублей, что вдвое дешевле, чем у КЦ.

Для определения эффективности работы бота Екатерина Быстрова указывает на следующие метрики:

«Мы всегда сравниваем количество согласий, которые абоненты дали роботу, с количеством согласий и подключений, которые прошли в наших системах. Если числа расходятся, значит, где-то нужно искать сложности.

Важна обращаемость — это какие-то претензии, когда клиенту не понравилось, как с ним поговорили, показалось, что что-то пошло не так. Как только растёт обращаемость, это сигнал».

Стоимость создания бота

Создать и внедрить бота можно двумя способами. Первый — заказать разработку за отдельную плату. Второй — сделать его самому, используя визуальный конструктор, это будет бесплатно. Некоторые не требуют знаний кода, в других надо уметь работать с Javascript.

Но в обоих случаях придётся оплачивать тариф для обслуживания бота. Стоимость тарифа определяется разными факторами: количество уникальных пользователей, минуты понимания и синтеза речи и пакеты минут телефонии.

Брать бота под заказ имеет смысл, когда у вас крупный проект со сложной логикой обработки обращений и общения с клиентом. По расчётам Just AI, стоимость разработки сложного текстового бота (их функционал совпадает с голосовыми роботами) составляет от 300 000 до 1 000 000 рублей. В нашем случае необходимо прибавить цену за тариф, ниже распишу среднюю стоимость. Чем сложнее ветка диалогов и больше функций, тем дороже выйдет бот.

Если вам нужен бот для более простых задач, например, опросник качества обслуживания, подтверждение записи или рекламная кампания, то подойдёт визуальный конструктор.

Конструкторы имеют интуитивно понятный интерфейс, где в шаблонах можно протестировать свой сценарий для бота, а затем использовать его. Также есть готовые решения — заранее собранные сценарии под разные бизнес-задачи. При необходимости разработчики за плату детальнее настроят вам отдельные функции бота. Ниже интерфейс конструктора Aimylogic.

Что такое голосовой бот и зачем он нужен бизнесу

Приведу конструкторы, которые компания Voximplant по итогу сравнения посчитала лучшими на рынке: это Robovoice, Infobot, Aimylogic и Voximplant Kit. На всех платформах кроме Infobot присутствует поддержка NLU системы, дополню список конструктором Leadozvon, в нём есть NLU. Везде представлены разные поставщики речевых технологий. Приведу среднюю цену за минуту в их стартовых тарифах.

Robovoice: пакет «Стартовый» 6,9 руб./минута. За 13 800 руб. получаете 2 000 минут на 3 месяца.

Infobot «Тариф AI» предлагает посекундную тарификацию: 10 коп./сек; 6 руб./минута, минимальное пополнение 1000 руб.

Aimylogic: пакет «Звонки Basic» 3,7 руб./минута, сюда входит 4000 минут за 7900 руб./месяц и отдельно докупается исходящая телефония: 1000 минут за 1700 руб.

Voximplant не имеет фиксированных тарифов, платить надо за аренду номера, поминутную тарификацию звонков и используемые функции. Стоимость лучше высчитывать индивидуально, поскольку перечень услуг большой, а цены провайдеров различаются. Ссылка на их цены.

Leadozvon: тариф «Автообзвон» обойдётся в 2.9 руб/минута, «Голосовой робот» обеспечивает работу многофункционального бота и стоит 5.9 руб./минута.

Вывод: кратко о том, что такое голосовой бот

Голосовой бот — это оператор с искусственным интеллектом (AI), который совершает и принимает звонки, а разговор ведёт по продуманному сценарию. За счёт AI робот способен распознать живую речь человека, понять её смысл и говорить синтезированным голосом.

Такой бот позволяет полностью заменить человека на большинстве рутинных задач. Робот идёт строго по фиксированному диалогу, поэтому сценарий отрабатывается максимально эффективно и конверсионно, в отличие от операторов, которые могут отходить от скрипта. За день робот обрабатывает более тысячи звонков и одновременно может вести разговор с сотнями клиентов. Если произойдёт всплеск звонков, робот сможет все обработать.

Если вам нужен сложный бот с большой веткой диалогов и разными функциями создавайте его под заказ. От сложности цена варьируется от 300 000 до 1000 000 миллиона рублей.

Если требуется простой бот используйте визуальные конструкторы, они бесплатны и имеют понятный интерфейс. Конструкторы: Robovoice, Infobot, Aimylogic и Voximplant Kit.

В обоих случаях придётся доплатить за тариф по обслуживанию бота.

Меня зовут Валентин Зайцев, я копирайтер и могу подготовить статью о вашем бизнесе — пишите на почту: valentinzaitsev2022@gmail.com

11
Начать дискуссию