{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Российский стартап Voca.Tech и «Яндекс.Облако» представили бейджи с микрофонами для анализа речи сотрудников Статьи редакции

Устройство стоит 9,5 тысяч рублей, а его обслуживание обойдётся от 999 рублей в месяц.

Российский стартап Voca.Tech в партнёрстве с «Яндекс.Облаком» представил бейджи с микрофонами для автоматического анализа речи сотрудников Voca.Badge. Устройства предназначены для крупных розничных компаний, рассказали vc.ru в «Яндексе».

Бейдж записывает речь сотрудника и передаёт файл в «Яндекс.Облако», после чего технология Yandex SpeechKit распознаёт и переводит речь в текст. Программа покажет работодателю, насколько вежливо и эффективно сотрудник общался с клиентом: например, дал ли он ему полную, достоверную и понятную информацию о товаре, не использовал ли слова паразиты и так далее.

Устройство стоит 9,5 тысяч рублей, в будущем Voca.Tech планирует предлагать бизнесу бейджи в аренду. Обслуживание обойдётся от 999 до 2499 рублей в месяц: тариф включает лицензии на управление бейджами, аналитику и распознавание от 30% до 100% разговоров.

Бейдж может автономно работать до 12 часов, говорят партнёры. Данные передаются с помощью Wi-Fi. Yandex SpeechKit различает названия лекарств, виды топлива, элементы спортивной экипировки и другие слова. Разработчики отмечают, что устройство способно распознавать речь даже в условиях шума — например, в зале ожидания московского аэропорта оно правильно определило не менее 80% слов.

Гендиректор Voca.Tech Бэлла Муталлапова рассказала vc.ru, что в 2019 году разработчик провёл 40 пилотных проектов с крупнейшими компаниями из сфер телекома, недвижимости, фармакологии и банковской отрасли. Конкретные компании она не назвала.

В августе 2019 года бейджи с возможностью аудиозаписи разговоров от Voca.Tech тестировал оператор Tele2, тогда для распознавания речи использовался когнитивный сервис Speech to Text Recognition в облаке Microsoft Azure.

Теперь в Voca.Tech уточнили, что выпустили несколько решений для пересональной речевой аналитики, в том числе для Yota и Tele2. Однако сделать универсальное решение, которое можно использовать в федеральной рознице, получилось только с использованием технологии Yandex SpeechKit.

В ноябре об использовании технологий Voca.Tech рассказали и в ВТБ. Стартап — участник корпоративного акселератора банка.

0
79 комментариев
Написать комментарий...
Василий Бициоха

Во многих крупных компаниях сейчас вводится подобная практика. Ее удобство заключается в том, что можно отказаться от практики тайного покупателя, который не всегда предоставляет объективные данных. Здесь информация будет объективной,  и можно проводить анализ разговоров. Конечно цена устройства отпугивает, так как 9 тыс. рублей за один бейдж, могут позволить не многие. Если у Вас например, 1000 продажников, то придется 9 миллионов отдать только за оборудование, еще важна поддержка  сервиса. И самый важный момент, как потом весь этот массив данный проанализировать. Представим себе крупную ритейл сеть, где ввели подобную практику. Кто потом и как будет анализировать информацию. Предположу - руководитель отдела продаж\управляющий салоном  и т.п. При этом конечно может заниматсья отдел контроля качества продаж, так его придется организовать для анализа. Вот здесь введении этой системы у меня первый "камень преткновения" - это анализ.Пока не могу придумать, как все проанализировать. Может кто-то видит эффективную схему? Расскажите! 

Ответить
Развернуть ветку
Юрий Б.

Система может тригериться на определенные слова или может интонации. Тогда в ручном режиме слушают одну запись. 

Вообще, это и есть работа специалиста по бигдате. Делать запрос к текстовым размеченным данным - это реальная задача (см картинку «питонистам мало платят»). Делать запрос к 50 млн часов звуковых файлов не имеет смысла.

Ответить
Развернуть ветку
76 комментариев
Раскрывать всегда