«Сбер» выпустил приложение SaluteSpeech App для синтеза и распознавания речи в аудио Статьи редакции
Доступно для Windows и macOS.
- SaluteSpeech App можно скачать со страницы «Сбера» для разработчиков.
- В приложении есть два раздела. «Распознавание» — для текстовой расшифровки голосовых файлов. «Синтез» — для озвучивания текста с возможностью настраивать паузы и ударения. Синтезировать текст можно разными голосами из семи вариантов на русском и английском языках. Сервис распознаёт аудио в шести форматах: pcm, opus, mp3, flac, alaw, mulaw.
- В приложение встроен GigaChat API, поэтому пользователь может загрузить короткие тезисы, нейросеть по ним подготовит текст для озвучивания. Также с помощью GigaChat в приложении можно сделать короткую выжимку длинного текста, а после озвучить материал.
- Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей. Есть бесплатный тариф для физлиц Freemium, по нему доступно 100 минут распознавания и 200 тысяч символов синтеза в месяц.
5.3K
показов
4.4K
открытий
"Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей"
Вот тебе вроде бы "бесплатное", но "600 рублей". Так и живём.
Комментарий недоступен
Не удивительно от них
А как может что-то быть бесплатным за 600р? Не уловил логику предложения.
Вы отдаете 600 рублей и оно становится для Вас совершенно бесплатным. Сберовские технологии, ёпта.
Само приложение бесплатно в цифровых магазинах. Можешь установить, в настройках полазить, например. Но для работы нужно оплатить подписку
Всегда мечтал бесплатно полазить в настройках
Редкий случай, когда журналист изнасиловал менеджера. Все просто: для физиков есть бесплатный пакет, для юриков поминутно, но не меньше 600р.
Работает же. С тебя 1200 рублей - 600 за синтез речи и 600 - за мат)))
F…f…f…f…Fujitsu
Whisper бесплатный чем хуже?
Комментарий удален модератором
Не понимаю только, зачем оно нужно. Вот на ютубе понятно, нужна была выжимка из видео, к примеру, а это..
Это для тех, кто не хочет никогда в жизни больше слушать голосовые
Телеграм премиум - 299 р, сбер-чудо - 600р. Не знаю, как там с интерграцией в другие приложения, подозреваю, что никак.
Вроде все люди уже давно привыкли слушать голосовые на повышенной скорости, смотреть видео в ютубе и вк на повышенной скорости, даже Сторис, Рилс и ТикТоки смотрят на повышенной скорости благодаря мобильному приложению ClipGlider ( https://clipglider.com/by-lang/ru/ )..
Может в сбере таки сделают возможность выставить СКОРОСТЬ сгенерированной речи? Алису от Яндекса нельзя заставить говорить быстрее, будет хоть какое-то преимущество перед Алисой у продукта СБера..
Не понимаю, что всем авторам подобных программ для синтеза речи мешает делать такую настройку скорости, технически ведь это тривиально реализуется!
Кстати на форбс ру есть увеличение скорости синтеза по озвучке статей х1,5 хорошая фитча
Круто, что хоть кто-то сделал ускорение озвучки статей! На форбс Маруся от ВК используется. Но тоже идиотизм, доступны только скорости 1х (без ускорения) и 1.5х, мне кажется надо было и 2х добавить..
“распознавания речи в аудио” - это как?
Опция нетрезвый собеседник
Пример бы, как там дела с интонацией
А какая разница в плане интонации?
Чтобы звучало более естественно, а не "роботоподобно" )) Для озвучки видео это важно может быть
Комментарий недоступен
А обычному пользователю будто подобная функция за деньги точно не нужна будет
Комментарий недоступен
А что за аналог?
Физические лица могут использовать сервис SaluteSpeech бесплатно в рамках тарифа Freemium:
распознавание речи: 100 минут аудио в месяц,
синтез речи: 200 000 символов в месяц.
Комментарий недоступен
Комментарий недоступен
Комментарий недоступен
Яндекс: Спасибо, Forgotten, записали
что дальше интересно придумают?)
все их поделки страшно триггерит тема соседей
""Здравствуйте, это вам звонит сотрудник Сбер..."" - стало еще более реалистично
какие реальные кейсы применения технологии?
Я пробовал с тестовой страницы.
Озвучка некоторых текстов работает довольно неплохо, озвучить русскоязычного автора вполне возможно.Транскрибацию не проверял.
В отношении оплаты,
для бизнеса - это возможность не платить диктору. 600 р. - озвучка более 3 млн. символов (186 рублей / 1 000 000 символов) . Если кто-то на этом зарабатывает - это не деньги.
бесплатные 200 тысяч для физ лица - это примерно озвучка небольшой главы, по сути, только поиграться. Да и получать халяву гимморно.
Так что, при всех плюсах технологии, для нас это выльется в потерю времени при попытке общаться с техподдержкой и увеличением количества спамзвоков с разными голосами.
К слову, сервис предлагает при озвучке использовать фоновые шумы, иммитации звонка из офиса. Так что радуйтесь, что не это бесплатно.
Чтобы потом это использовали их колл-центры в местах не столь отдаленных?
кому интересно, услышать голоса от сберосигнала можно по ссылке
https://developers.sber.ru/portal/products/smartspeech