История Dasha.AI — робота-обзвонщика, которого принимают за человека в среднем 95 собеседников из 100

Сейчас его создатели Владислав Чернышов и Александр Зайцев работают над платформой, с помощью которой пользователи смогут создавать личных голосовых помощников — не хуже Google Duplex.

Dasha.AI — сервис для автоматизации колл-центров, который моделирует человеческую речь с помощью искусственного интеллекта.

Для создания живой беседы робот использует слова-паразиты, перебивает собеседника, поддакивает и при необходимости отвлекается от основной темы разговора.

Если Dasha перебить в ответ, робот выслушает собеседника и выстроит дальнейший диалог исходя из контекста.

Компанию основали в 2018 году двоюродные братья Владислав Чернышов и Александр Зайцев. До весны 2019 года они развивали сервис на собственные средства, а в марте американский фонд RTP Ventures и европейский RTP Global (связаны с миллиардером Леонидом Богуславским) инвестировали в компанию $2 млн.

Стартап планирует потратить деньги на расширение команды — сейчас в ней 50 человек, включая Александра Дьяконова, доктора физико-математических наук и победителя соревнований для специалистов в сфере ИИ от сообщества Kaggle.

Кроме того, компания собирается увеличить присутствие на рынке США — сейчас технологию Dasha.AI тестируют несколько американских компаний. Их названия Чернышов не раскрывает, но отмечает, что они входят в список Fortune 1000.

Сегодня у компании около 18 клиентов. В России технологии Dasha.AI использовал «2ГИС», но позже разработал похожее решение, отмечал руководитель картографического сервиса Александр Сысоев.

А операционный директор «Модульбанка» Антон Липатов рассказал «Коммерсанту», что за первый месяц работы робот Dasha.AI опросил в четыре раза больше клиентов по сравнению с операторами колл-центра. Банк внедрил технологию летом 2018 года.

Кроме того, команда работает над платформой для самостоятельного моделирования разговоров, с помощью которой рядовые пользователи смогут создавать себе виртуальных ассистентов вроде Google Duplex (пока что Dasha.AI работает индивидуально с каждым клиентом).

В компании хотят, чтобы пользовательские роботы не просто выполняли однотипные задачи, как большинство виртуальных ассистентов, а сами выбирали наиболее оптимальное поведение в той или иной ситуации.

Сейчас, чтобы создавать виртуальных ассистентов, нужно быть кандидатом наук, а мы хотим, чтобы это могла делать любая домохозяйка.

Владислав Чернышов, сооснователь Dasha.AI

Почему Dasha «умнее» остальных голосовых ассистентов

Сотрудники Dasha.AI вручную прописывают сценарий, по которому робот будет общаться с клиентами заказчика.

Для озвучивания используется технология гибридного синтеза речи — сперва диктор записывает фразы, словосочетания, слова или слоги, которые затем с помощью алгоритмов цифровой обработки сигналов «склеиваются» в предложения с подходящей интонацией.

Во время разговора Dasha распознаёт смысл сказанного при помощи алгоритма машинного обучения и «понимает», по какой ветке диалога выстраивать беседу дальше.

Робот может сообщить клиенту интернет-магазина, что его заказ прибыл в почтовое отделение, а если тот поинтересуется, в какое именно, — Dasha подскажет его номер или отправит SMS с адресом.

Если собеседник говорит непонятные роботу вещи, Dasha переведёт разговор на сотрудника колл-центра. Если робот понимает, что подключить к беседе некого, то извиняется за плохую связь и кладёт трубку. Также робот умеет перезванивать через оговоренное время.

Для распознавания голоса используются API от Google и «Яндекса», а также собственные наработки команды Dasha.AI. Технология компании базируется на диссертации Чернышова и технического директора компании Ильи Ступакова.

Илья Ступаков и Владислав Чернышов
Илья Ступаков и Владислав Чернышов

Одна из проблем, которую им потребовалось решить, — задержка во время разговора.

Когда мы говорим о голосовом движке, на первое место выдвигаются нюансы, связанные с задержками. Очень важно сделать так, чтобы когда пользователь закончил говорить, робот начал сразу ему отвечать.

Мы определили, что среднее время ожидания, комфортное для человека, — 400 миллисекунд. За это время система должна перевести речь в текст, извлечь смысл и принять решение, что делать дальше.

Владислав Чернышов, сооснователь Dasha.AI

Робот поддерживает живой диалог: при необходимости перебивает, может переформулировать один и тот же вопрос, если человек его не понял, и использует слова-паразиты вроде «гм», «ага» и другие.

История создания Dasha.AI

В 2007 году Чернышов принял участие в первом конкурсе для Android-разработчиков от Google, а также участвовал в чемпионате мира по программированию ACM ICPC. Но программистом он не стал и ушёл в бизнес — открыл свою строительную компанию.

Её оборот он не раскрывает, но отмечает, что к 2013 году в ней работало более 150 сотрудников. Однако кризис 2014 года бизнес не пережил и обанкротился.

Однако этот опыт помог Чернышову увидеть проблему: заказчикам строительных работ было сложно спланировать бюджет. Тогда предприниматель решил создать «Uber для строителей» — приложение, с помощью которого пользователь мог бы составить план расходов и сразу получить смету.

Первый прототип Чернышов собрал в 2016 году. Версию для iOS написал на Swift, для Android — на Java, а бэкенд — на Node.js и C #. Над приложением он работал вместе со своим двоюродным братом Александром Зайцевым.

Чернышов хотел сделать сервис удобнее: чтобы пользователь мог голосом перечислить объём работы (например: «поменять две двери, заменить смеситель и постелить 3 м² ламината в коридоре») и узнать её стоимость. Для этого он встроил технологию обработки естественного языка (natural language processing, NLP), и приложение научилось синтезировать речь.

Несмотря на свою функциональность, приложение не стало популярным. Но функция распознавания и синтеза речи так понравилась Чернышову, что он сделал новый продукт на её основе — Dasha.AI.

Команда Dasha.AI
Команда Dasha.AI

Робот продаёт лестницы

Александр Зайцев помогал отцу развивать семейную компанию, которая занималась деревообработкой в Новосибирске, в частности — производством лестниц для коттеджей.

К тому времени местный рынок казался Зайцеву тесным, и он хотел найти дилеров в других регионах. Однако у него не было ресурсов, чтобы увеличить штат менеджеров по продажам.

Тогда в ноябре 2016 года он попросил Чернышова «научить» приложение холодным звонкам, чтобы искать строителей-подрядчиков для сотрудничества. Чернышов потратил три месяца на создание программы, и в январе 2017 года сервис совершил первый звонок.

Первая версия робота, февраль 2017 года

В базу загружались телефонные номера мастеров, которые занимались монтажом лестниц, и робот их обзванивал. Он делал презентацию компании и рассказывал об условиях сотрудничества.

Если собеседник интересовался, робот просил его прислать SMS с номером телефона и электронной почтой, а в ответ отправлял договор и информацию о сотрудничестве. Затем с дилером связывались менеджеры, чтобы закрыть сделку.

Первый клиент в США

После успешного теста прототипа Чернышов и Зайцев решили, что сервис нужно развивать дальше, и в мае 2017 года подали заявку в акселератор Y Combinator. Их пригласили на очное интервью в США, однако денег на поездку у них не было. Тем не менее братьям удалось занять у знакомых около $5000.

Прототип был на русском, поэтому переводить его на английский пришлось уже на месте. Предпринимателям казалось, что интервью прошло удачно, однако они получили отказ — руководитель Y Combinator Майкл Сайбл и партнёры акселератора не поняли, как Dasha.AI сможет зарабатывать деньги в будущем.

Несмотря на неудачу, братья не торопились возвращаться домой. Чернышов разослал прототип Dasha.AI знакомым из США и попросил их рассказать о сервисе друзьям. Задумка удалась, и на следующий день предприниматели подписали первый контракт с сетью стоматологических кабинетов в Сан-Франциско. Сумма контракта на тот момент не превышала $5000.

Это четыре-пять стоматологических кабинетов в Сан-Франциско. Сейчас с ними не работаем.

Мы начали развиваться и поняли, что это слишком маленький для нас проект, нам стало неинтересно. Но важен сам факт, что наш первый клиент был из США.

Владислав Чернышов, сооснователь Dasha.AI

В начале июня 2017 года братья вернулись в Россию и начали искать клиентов, одним из первых стал сервис «2ГИС». По словам предпринимателя, многие клиенты пришли благодаря «сарафанному радио». Также компании стали приходить предложения от инвесторов после статьи на vc.ru.

Монетизация Dasha.AI и развитие стартапа сегодня

Сегодня стартап внедряет пилотные проекты для крупных заказчиков. По словам Чернышова, это помогает не только «набивать шишки», но и накапливать данные — записи разговоров — для тренировки нейросетей.

Стартап работает с компаниями из сферы банкинга, финансов, страхования и технологий. Среди основных предложений Dasha.AI:

  • NPS-опросы.
  • Верификация доставки.
  • Дополнительные продажи.
  • Назначение, отмена и перенос приёмов врача.

  • Замена операторов первой линии на входящих звонках.

По словам Чернышова, все клиенты расширяют количество кейсов в течение трёх месяцев. Рекорд компании на сегодня — восемь кейсов на одного клиента.

После запуска проекта клиент выплачивает ежемесячную сумму по модели подписки. Цена рассчитывается индивидуально и зависит от опций, которые выбрал клиент.

  • Первая установка ПО и кастомизация под бизнес-процессы стоит от 500 тысяч до 1 млн рублей.
  • Оплата минут за разговоры. В зависимости от объёма звонков минута стоит от 4,17 рублей до 6,67 рублей.
  • Есть единоразовый платёж, который клиент платит за дополнительную настройку.

Перед запуском робота Dasha.AI и клиент выбирают целевые показатели. Один из самых частых — процент неудачно завершённых разговоров (conversation error rate — CER), когда робот либо отвечает невпопад, либо выдаёт себя. По словам Чернышова, удовлетворительный результат — не более 5% отказов при разговоре с роботом, а рекорд команды — 0,8%–0,5% отказов.

Пример разговора Dasha с человеком

Планы

Чернышов хочет превратить Dasha.AI в платформу, с помощью которой пользователи смогут создавать виртуальных ассистентов и любые другие разговорные голосовые модели.

Например, свою работу сможет автоматизировать скупщик деталей: ассистент будет звонить, спрашивать цены, характеристики и скупать подходящие экземпляры.

А если на стороне поставщика тоже будет робот, то работа полностью автоматизируется. Чернышов называет такое общение natural language.

Разработчик рассказывает, что с помощью синтеза речи можно автоматизировать многие рутинные вещи. Например, добавить голосовой интерфейс к постаматам Amazon, чтобы пользователям не приходилось каждый раз набирать пароль. В этом случае пользователь сможет попросить устройство отдать посылку, а постамат идентифицирует его по голосу и определит, в какой именно ячейке находится заказ, — и откроет её.

У нас уже есть эта технология. Планируем скоро выкатить её в продакшн. Мы сможем в реальном времени подтверждать личность человека по голосу. Это будет базовая функциональность нашей новой платформы.

С нами связались парни из Бостона, которые делают роботов для приготовления смузи на базе Google Dialogflow, но там их не устраивает синтез и разнообразие речи. Они хотят сделать робота на базе Dasha.AI, чтобы человек мог не просто попить кофе или смузи, но ещё и поболтать с роботом.

Владислав Чернышов, сооснователь Dasha.AI
8686
174 комментария

Лично меня чудовищно напрягает, когда под видом живого человека мне подсовывают робота. Скажите, что звонит робот и я буду взаимодействовать с ним как с машиной. Но вот эта попытка меня обмануть (а это обман) - лично для меня неприемлема и, на мой взгляд, подрывает основы человеческого взаимодействия.

140
Ответить

Замечал за собой похожие чувства.
Непонятно, чем именно это вызвано. Мне кажется, что при взаимодействии с человеком у нас есть чувство некоего паритета, который мог бы быть выражен подобными вещами:
- и ты и я тратишь время на контакт
- и ты и я испытываешь эмоции. Если выражу свои эмоции - ты на них эмоционально отреагируешь.
Робот в таком ключе оказывается выше нас. И эта не равность, а затем и чувство несправедливости - возможно и есть "ощущение обмана". Если понимаем, что это робот, то эмоционально вкладываться хочется значительно меньше, но также и меньше "обязанностей" перед ним, чем при общении с живым человеком.

37
Ответить

Лет через 5-10 голосовые ассистенты будут разговаривать друг с другом, затем AI будет анализитовать логи этих разговоров и выдавать хозяину (через этих самих ассистентов) саммариз, а в некоторых случаях - действовать самостоятельно. На следующем этапе голос упразднится, так как стороны смогут между собой через API бщаться. У каждого человека будет личный AI с API, который будет разруливать большинство ситуаций. Размеется, он будет самообучаемым (типа спам-фильтра).

Ребята - смотрите в будущее. Нафиг голос.

16
Ответить

c развитием роботов их еще и научат говорить дОговор и звОнят

11
Ответить

В разумных государствах это скоро будет ограничено, заставят представляться роботом.
А пока эта лазейка дает хороший картбланж для развития технологии.
Нельзя зарегулировать на взлете, так это может привести к падению, а это уже удар по макроэкономики, т.е. конкурентоспособности страны.

9
Ответить

У меня наоборот: я буду больше рад поговорить с роботом, который ЗАТОЧЕН под то, чтобы понять меня и помочь мне, в отличие от уставшего и не сильно умного человека, натренированного говорить по скрипту за маленькую зарплату, который не слышит и не хочет слышать что ему говоришь.

8
Ответить

Надо первым вопросом задавать: вы робот? Если он ответит,что нет,но при этом тест Тьюринга не пройдет,то велкам в суд. Обман и ввод в заблуждение потребителя.

2
Ответить