Glagol – СКОРО во всех телефонах страны!

В настоящие время автоматизация всех процессов приняла лавинообразный эффект. Это явление не могло пройти мимо нашей компании и мы создали "Glagol"

Откуда ноги растут? Наша компания занимается call-центрами уже 5 лет. А лично я в этом направлении 7 лет, и имел опыт руководства call центром Сбербанка России. Также вторым направлением бизнеса у нас была разработка программного обеспечения под заказ.

И вот в один прекрасный день мы сидели за столом на совещании и подняли вопрос об автоматизации разговоров операторов. И в голову пришла мысль о создании робота, который смог бы заменить операторов первой линии. Сказано – сделано… мы приступили к разработке.

Это, что получилось в итоге:

Тут надо отметить один момент. Мы начали разработку именно с архитектуры самих разговоров (как люди ведут разговор), а не с технологии (каким образом это запрограммировать). Это было обусловлено тем, что в первую очередь мы – это call-центр, и наши клиенты не должны были заметить разницы между нашими операторами и "роботом". В этом у нас фундаментальное отличие от подобных разработок.

По началу все было очень топорно. Все технологии, которые существовали, хоть и охватывали большой кусок разработки, но не хватало в них самого важного: КАК и КУДА вести диалог. И тут на выручку пришла великая и могучая МАТЕМАТИКА, а именно матричная алгебра (благо с ней мы знакомы очень близко). Создали ядро, которое, как человек, могла вести диалог. Прыгая с темы на тему, помня все, что говорили, подстраиваться под диалог и настаивать на своем. Мы подцепили различные сервисы распознавания и генерации речи. И тут пошли косяки:

  • Сгенерированная речь очень НЕчеловекоподна.
  • Распознавание неточное (ни один сервис не распознавал речь с необходимой точностью – ни великий Яндекс, ни страшный и огромный Google.

И тут появился клиент, который хотел нашу разработку, хоть она и не была полностью готова. А клиент был очень хороший.

Осознавая, что обратного пути нет, мы принялись за работу.

  • Мы разработали систему записи и склеивания звуковых файлов. Это не только система, но и список рекомендаций к процессу записи аудио файлов.

Теперь люди не отличали речь робота и речь живого оператора.

Женский голос - робот
  • Понимая, что обучить свою нейронную сеть для распознавания у нас не хватит времени, мы сосредоточились на адаптации того, что передают нам API сторонних систем по распознаванию (таких как Яндекс, Google и так далее).

У нас получилась система смыслов, которая учится на диалогах, и адаптирует полученные данные по API в смысловой контекст. Если проще, система предполагает, что в этом смысловом ряду не может быть того, что она услышала, и подбирает похожие слова или фразы под звучание (например: “Да, говорите” и “Договорились” звучание у этих единиц похоже, а вот использование в смысловой конструкции разное).

Теперь точность прохождения блоков выросла.

  • После всех манипуляций с кодом, мы подключили первого клиента. Это большая компания, которая занимается ценными бумагами.

Клиент остался доволен.

После обучения системы для клиента, мы провели небольшое состязание между человеком и нашим ”роботом”, они звонили по одной базе, деленной "рандомно". По итогам у человека конверсия 11%, а у нашего робота 12%. Вот так люди и начинают проигрывать компьютерам.

После этого к нам начали подключаться новые клиенты. При этом мы никак не были представлены на рынке. Про нас просто рассказывали друг другу довольные клиенты (впервые видел, как работает сарафанное радио☺)

Glagol – СКОРО во всех телефонах страны!

Но был один недостаток – наша система довольно дорога в настройке, приходиться адаптировать код под конкретного клиента, что занимает часы работы программистов. Немного подумав, мы решили, что надо дать возможность любому человеку, без навыков и знаний в программировании, использовать нашу разработку. Сказано- сделано...Мы приступили к разработке(где-то я это уже писал☺)

Для начала надо было определиться с концепцией, и у нас получилось четыре пункта:

  • Это должен быть конструктор с визуальным интерфейсом.
  • В него должны подключаться все API по распознаванию и генерации речи, при этом наши разработки по интерпретации текста, получаемого по API, и система создания звонка из записей должны быть в этой системе.
  • В систему должны заводиться свои sip линии.
  • И все должно быть очень гибко.

Как оказалось, разработать подобного монстра не так уж и просто. Сама система есть сочетание матричной алгебры и нейронных сетей. А пользователю не надо знать подобных вещей. И вот спустя полгода разработки интерфейса, у нас появилась первая версия личного кабинета. Урааааа =))

Теперь почти любой человек, после небольшого обучения может создавать своих “роботов” для входящих и исходящих звонков. У нас получился своеобразный конструктор для роботов.

P. S.Выбрал VC для публикации отчетов о нашем дальнейшем развитии, так что ждите новых статей о наших подвигах в будущем

33
4 комментария

Очень интересно

Кто конкуренты, какие есть аналоги?
Может быть смежные сферы применения...

Интересно стать вашими партнёрами