«Сбер» выпустил приложение SaluteSpeech App для синтеза и распознавания речи в аудио

Доступно для Windows и macOS.

  • SaluteSpeech App можно скачать со страницы «Сбера» для разработчиков.
  • В приложении есть два раздела. «Распознавание» — для текстовой расшифровки голосовых файлов. «Синтез» — для озвучивания текста с возможностью настраивать паузы и ударения. Синтезировать текст можно разными голосами из семи вариантов на русском и английском языках. Сервис распознаёт аудио в шести форматах: pcm, opus, mp3, flac, alaw, mulaw.
  • В приложение встроен GigaChat API, поэтому пользователь может загрузить короткие тезисы, нейросеть по ним подготовит текст для озвучивания. Также с помощью GigaChat в приложении можно сделать короткую выжимку длинного текста, а после озвучить материал.
  • Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей. Есть бесплатный тариф для физлиц Freemium, по нему доступно 100 минут распознавания и 200 тысяч символов синтеза в месяц.
Синтез речи в SaluteSpeech App
Синтез речи в SaluteSpeech App
«Сбер» выпустил приложение SaluteSpeech App для синтеза и распознавания речи в аудио
13
33 комментария