{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Speech Analytics - обработка аудиозаписей

Владение языком — важнейшая человеческая способность, которая отличает его от обезьяны. Способность понимать человеческий язык является одной из главных составляющих искусственного интеллекта.

За последние несколько лет мы наблюдаем стремительный рост технологий, связанных с машинной обработкой естественного языка. Google, Microsoft и Яндекс являются лидерами в данной области. Обладая базовым уровнем знаний Python, возможно реализовать проект по машинной обработке речи.

Как машинная обработка речи может быть связанна с работой финансовой организации?

Телефонный звонок до настоящего времени остается основным способом коммуникации клиента и финансовой организации. Практически все звонки для контроля записываются, а это миллионы звонков в год (миллионы, КАРЛ!). Например, база переговоров брокеров и клиентов за период чуть больше полугода составляет около 200 тысяч аудиофайлов общей продолжительностью порядка 7 тысяч часов или 300 дней! И это лишь небольшая часть от общего количества звонков.

Как обработать такой объем данных?

Обрабатывать такой объем информации прослушиванием – нерационально. Поэтому командами аудиторов был создан инструмент с использованием библиотек Python, позволяющий обрабатывать общение брокеров с клиентами.

Как проводить контроль выполнения правил и стандартов в финансовой организации? При анализе диалога клиента и брокера контролируется наличие поручений клиента по покупке/продаже и наличие запроса пароля от брокера. Например, ищем ключевые слова в аудиозаписи – «покупка», «продажа», «пароль». Ключевые слова позволят нам оценивать выполнение стандартов общения с клиентом, правильность выполнения операций и соблюдения требований по безопасности.

​Рисунок 1 – Пример поиска кодовых слов

На рис.1. показана разметка двух аудиозаписей, где были найдены ключевые слова:

  • в первом аудиофайле было найдено слово «Покупка» на 47 секунде,
  • во втором аудиофайле были найдены слова «Продажа», «Покупка» и «Пароль»

Также с использованием аудиоданных из переговоров клиента и брокера возможно сопоставить данные позвонившего клиента, полученные с помощью инструмента с данными клиента из анкеты. Для этого проводим диаризацию аудиофайла переговоров с помощью модуля librosa языка Python. Модуль осуществляет определение речи в аудио и выделение участников диалога на основе извлечения признаков речи. Определив участников диалога, мы можем: 1) выявить заявки, по которым пол позвонившего и пол клиента не совпадают,

Рисунок 2 – Точность реализованных моделей по определению пола​

2) выявить разных клиентов, заявки которых поданы одним и тем же голосом.

Реализуя в коде вышеприведенную последовательность действий, Вы убедитесь, что любой, обладающий базовыми знаниями языка Python, а также навыком чтения документации для использования готовых библиотек, способен реализовать продукт по машинной обработке речи, сопоставимый по качеству с решениями лидеров рынка.

0
Комментарии
-3 комментариев
Раскрывать всегда