SberDevices представила семейство моделей машинного обучения для распознавания русскоязычной речи и эмоций Статьи редакции

Исходный код открытый, лицензия — некоммерческая.

Универсальную акустическую модель GigaAM можно адаптировать под распознавание речи, эмоций и дикторов, рассказала команда SberDevices. Её обучали на наборе данных из 50 тысяч часов речи.
GigaAM-Emo тренировали определять именно эмоции. Её дообучали на наборе Dusha: он состоит из записей речи продолжительностью до 20 секунд. Часть аудио записали актёры озвучки, остальные собраны из подкастов. Каждой записи приписана одна из четырёх состояний: злость, грусть, нейтральная эмоция или счастье.
GigaAM-CTC затачивали под распознавание запросов и дообучали на корпусах Golos SberDevices, Sova, CommonVoice и LibriSpeech. Качество тестировали на семи срезах данных, учитывая как запросы для «умных» колонок, так и записи из телефонных каналов. В коротких запросах она допускает на 20-35% меньше ошибок в словах, чем такие решения, как NeMo-Conformer-RNNT и Whisper-Large-v3, сообщили в SberDevices.
Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.
Улучшенные версии доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Пользователи последнего могут опробовать решения в повседневных задачах: распознать запись совещания или лекции в вузе.

#новости #сбер

6.3K показов

3.1K открытий

58 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Тоже хочу

8 апр

Сбер опять чужой опенсорс за свой выдает?
https://vc.ru/tribuna/1009612-mihalkov-razoblachil-ii-ot-sber

Михалков разоблачил ИИ от Сбер — Трибуна на vc.ru

Никита Михалков наглядно показал, как разрабатываются цифровые сервисы в Сбер, в частности…

vc.ru

Ответить

Развернуть ветку

Vladimir Ponomarev

8 апр

О нет! Там же неправильная дата публикации, должно быть 01/04, правда же? DEVсагон-ТВ от Михалкова.🤦‍♂️

Ответить

Развернуть ветку

Показать 58 комментариев . Вы видите только часть дискуссии

Написать комментарий...

55 комментариев

Раскрывать всегда