«Сбер» представил сервис речевых технологий для бизнеса Статьи редакции
Сервис распознает и синтезирует речь, а также может использовать «подсказки», чтобы лучше понимать пользователя.
SmartSpeech позволит бизнесу без специального оборудования подключать речевые технологии — например, в интерактивном голосовом меню, автоответчике, чатах и других голосовых интерфейсах, говорится на сайте «Сбера».
До конца 2021 года функцию можно подключить бесплатно. На момент написания заметки в банке не уточнили vc.ru, сколько сервис будет стоить потом.
SmartSpeech можно использовать на сайтах, в приложениях и «умных» устройствах для озвучивания контента и команд или голосового ввода. Для этого достаточно загрузить текст, и робот сам прочтёт его вслух — заранее записывать речь не придётся.
Сервис распознаёт и синтезирует речь, а также способен использовать «подсказки», чтобы понимать пользователя в зависимости от конкретной ситуации. В сервисе доступно несколько голосов, в будущем банк намерен расширять библиотеку.
Чтобы протестировать SmartSpeech, нужно оставить заявку на подключение. Банк предоставит программный интерфейс, который можно встроить в продукты.
В банке уже используют эту технологию, например, в основе семейства виртуальных ассистентов «Салют». В компании отмечают, что функция поможет «быстро, эффективно и малозатратно» решить вопрос, с которым обращается клиент.
Кто в теме, можно уже самому нейросетку воткнуть на свой сервер и получить уровень распознавания на уровне гугловких API?
попробуйте vosk (https://alphacephei.com/vosk/)
В целом, подходит по требованиям, только надо будет дообучать для того, чтобы лучше понимала какой-нибудь вас интересующий домен (например, слово "смс" она не распознает, - нужно отдельно с ним поработать, если это критично), но она вполне себе нормально работает по "общим" словам.