«Сбер» выпустил приложение SaluteSpeech App для синтеза и распознавания речи в аудио Статьи редакции

Доступно для Windows и macOS.

  • SaluteSpeech App можно скачать со страницы «Сбера» для разработчиков.
  • В приложении есть два раздела. «Распознавание» — для текстовой расшифровки голосовых файлов. «Синтез» — для озвучивания текста с возможностью настраивать паузы и ударения. Синтезировать текст можно разными голосами из семи вариантов на русском и английском языках. Сервис распознаёт аудио в шести форматах: pcm, opus, mp3, flac, alaw, mulaw.
  • В приложение встроен GigaChat API, поэтому пользователь может загрузить короткие тезисы, нейросеть по ним подготовит текст для озвучивания. Также с помощью GigaChat в приложении можно сделать короткую выжимку длинного текста, а после озвучить материал.
  • Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей. Есть бесплатный тариф для физлиц Freemium, по нему доступно 100 минут распознавания и 200 тысяч символов синтеза в месяц.
Синтез речи в SaluteSpeech App
0
39 комментариев
Написать комментарий...
Слегка Придурковатый

"Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей"

Вот тебе вроде бы "бесплатное", но "600 рублей". Так и живём.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Руслан Блохин

Не удивительно от них

Ответить
Развернуть ветку
Илья Заводов

А как может что-то быть бесплатным за 600р? Не уловил логику предложения.

Ответить
Развернуть ветку
Вася Пражкин

Вы отдаете 600 рублей и оно становится для Вас совершенно бесплатным. Сберовские технологии, ёпта.

Ответить
Развернуть ветку
Gorbun iz Notr Dama

Само приложение бесплатно в цифровых магазинах. Можешь установить, в настройках полазить, например. Но для работы нужно оплатить подписку

Ответить
Развернуть ветку
Твой друг и товарищ

Всегда мечтал бесплатно полазить в настройках

Ответить
Развернуть ветку
Дмитрий Кузнецов

Редкий случай, когда журналист изнасиловал менеджера. Все просто: для физиков есть бесплатный пакет, для юриков поминутно, но не меньше 600р.

Ответить
Развернуть ветку
Невероятный Блондин
Его минимальная стоимость за месяц использования — 600 рублей
Ответить
Развернуть ветку
Андрей Мельник

Работает же. С тебя 1200 рублей - 600 за синтез речи и 600 - за мат)))

Ответить
Развернуть ветку
Невероятный Блондин

F…f…f…f…Fujitsu

Ответить
Развернуть ветку
Vladimir Saranyuk

Whisper бесплатный чем хуже?

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Ovechkin

Не понимаю только, зачем оно нужно. Вот на ютубе понятно, нужна была выжимка из видео, к примеру, а это..

Ответить
Развернуть ветку
Варя Исаева

Это для тех, кто не хочет никогда в жизни больше слушать голосовые

Ответить
Развернуть ветку
Pavel Klimov

Телеграм премиум - 299 р, сбер-чудо - 600р. Не знаю, как там с интерграцией в другие приложения, подозреваю, что никак.

Ответить
Развернуть ветку
Vlad

Вроде все люди уже давно привыкли слушать голосовые на повышенной скорости, смотреть видео в ютубе и вк на повышенной скорости, даже Сторис, Рилс и ТикТоки смотрят на повышенной скорости благодаря мобильному приложению ClipGlider ( https://clipglider.com/by-lang/ru/ )..

Может в сбере таки сделают возможность выставить СКОРОСТЬ сгенерированной речи? Алису от Яндекса нельзя заставить говорить быстрее, будет хоть какое-то преимущество перед Алисой у продукта СБера..

Не понимаю, что всем авторам подобных программ для синтеза речи мешает делать такую настройку скорости, технически ведь это тривиально реализуется!

Ответить
Развернуть ветку
Vitaly Ya

Кстати на форбс ру есть увеличение скорости синтеза по озвучке статей х1,5 хорошая фитча

Ответить
Развернуть ветку
Vlad

Круто, что хоть кто-то сделал ускорение озвучки статей! На форбс Маруся от ВК используется. Но тоже идиотизм, доступны только скорости 1х (без ускорения) и 1.5х, мне кажется надо было и 2х добавить..

Ответить
Развернуть ветку
Вася Пражкин

“распознавания речи в аудио” - это как?

Ответить
Развернуть ветку
Невероятный Блондин

Опция нетрезвый собеседник

Ответить
Развернуть ветку
умный человек

Пример бы, как там дела с интонацией

Ответить
Развернуть ветку
vinniy pogreb

А какая разница в плане интонации?

Ответить
Развернуть ветку
Maxim Sergeevich

Чтобы звучало более естественно, а не "роботоподобно" )) Для озвучки видео это важно может быть

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Лара Бёрд

А обычному пользователю будто подобная функция за деньги точно не нужна будет

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Assa

А что за аналог?

Ответить
Развернуть ветку
Дмитрий Кузнецов

Физические лица могут использовать сервис SaluteSpeech бесплатно в рамках тарифа Freemium:

распознавание речи: 100 минут аудио в месяц,
синтез речи: 200 000 символов в месяц.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Тимофей Измайлов

Яндекс: Спасибо, Forgotten, записали

Ответить
Развернуть ветку
Василий Алёхин

что дальше интересно придумают?)

Ответить
Развернуть ветку
неформат

все их поделки страшно триггерит тема соседей

Ответить
Развернуть ветку
Тоже хочу

""Здравствуйте, это вам звонит сотрудник Сбер..."" - стало еще более реалистично

Ответить
Развернуть ветку
AlexMn

какие реальные кейсы применения технологии?

Ответить
Развернуть ветку
Правильный Взгляд

Я пробовал с тестовой страницы.
Озвучка некоторых текстов работает довольно неплохо, озвучить русскоязычного автора вполне возможно.Транскрибацию не проверял.

В отношении оплаты,
для бизнеса - это возможность не платить диктору. 600 р. - озвучка более 3 млн. символов (186 рублей / 1 000 000 символов) . Если кто-то на этом зарабатывает - это не деньги.
бесплатные 200 тысяч для физ лица - это примерно озвучка небольшой главы, по сути, только поиграться. Да и получать халяву гимморно.
Так что, при всех плюсах технологии, для нас это выльется в потерю времени при попытке общаться с техподдержкой и увеличением количества спамзвоков с разными голосами.
К слову, сервис предлагает при озвучке использовать фоновые шумы, иммитации звонка из офиса. Так что радуйтесь, что не это бесплатно.

Ответить
Развернуть ветку
Uzabila
для синтеза и распознавания речи

Чтобы потом это использовали их колл-центры в местах не столь отдаленных?

Ответить
Развернуть ветку
Правильный Взгляд

кому интересно, услышать голоса от сберосигнала можно по ссылке
https://developers.sber.ru/portal/products/smartspeech

Ответить
Развернуть ветку
36 комментариев
Раскрывать всегда