Yandex Cloud запустил сервис генерации голосов для виртуальных операторов колл-центров Статьи редакции

Он синтезирует речь по одной фразе и передаёт интонацию реального человека.

  • На облачной платформе Yandex Cloud появился сервис Brand Voice Call Center, рассказали в компании.
  • Алгоритм способен обработать аудиошаблон и создать на его основе сотни других реплик. При этом его можно научить обращаться к собеседнику по имени или согласовывать адреса и набор товаров в заказе. В сгенерированных фразах также можно менять отдельные слова.
  • Речь, сгенерированная с помощью Brand Voice Call Center, звучит естественно и передаёт детали речи человека из шаблона: интонации, изменения громкости. А в качестве образцов можно использовать записи реальных разговоров операторов колл-центров.
  • Для обучения алгоритма использовали тысячи часов записей русскоязычных дикторов. Это позволяет работать практически с любым голосом без предварительной подготовки.
  • Клиенты сервиса должны будут платить только за запросы — бюджет на обучение и поддержку алгоритма не потребуется. Перечень тарифов и их стоимость в компании не раскрыли.
  • В июле 2021 года «Яндекс» запустил Yandex SpeechKit Brand Voice — сервис для создания фирменных голосов виртуальных помощников. Стоимость его использования начинается от 13,2 рубля за 10 тысяч символов в месяц.
  • Также у компании есть сервис Brand Voice Premium, он позволяет синтезировать голоса для маркетинговых и PR-компаний.
0
63 комментария
Написать комментарий...
Вадим Д.

Круто, конечно, но когда ждать новую волну звонков от псевдоживых операторов? которых теперь вообще хрен от людей отличишь?

Ответить
Развернуть ветку
Вася Пражкин
которых теперь вообще хрен от людей отличишь?

Попроси оператора произнести «300». Нормальный человек никогда на поводу не пойдет ).

Ответить
Развернуть ветку
Дарья

ну это гениальная проверка просто

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Евгений Фрост

Подруга работает на линии поддержки. За пару месяцев работы вырабатывается такой ж/б фильтр на всякие оскорбления, что у большинства в процессе выслушивания покерфейс покруче чем у профессиональных обколотых ботоксом игроков в покер. Проще говоря большинству сотрудников колл-центров настолько пофиг, что они чисто работают по скрипту, как нейросетка для озвучки заранее написанных текстов.

Ответить
Развернуть ветку
60 комментариев
Раскрывать всегда