реклама
разместить

SberDevices представила семейство моделей машинного обучения для распознавания русскоязычной речи и эмоций

Исходный код открытый, лицензия — некоммерческая.

  • Универсальную акустическую модель GigaAM можно адаптировать под распознавание речи, эмоций и дикторов, рассказала команда SberDevices. Её обучали на наборе данных из 50 тысяч часов речи.
  • GigaAM-Emo тренировали определять именно эмоции. Её дообучали на наборе Dusha: он состоит из записей речи продолжительностью до 20 секунд. Часть аудио записали актёры озвучки, остальные собраны из подкастов. Каждой записи приписана одна из четырёх состояний: злость, грусть, нейтральная эмоция или счастье.
  • GigaAM-CTC затачивали под распознавание запросов и дообучали на корпусах Golos SberDevices, Sova, CommonVoice и LibriSpeech. Качество тестировали на семи срезах данных, учитывая как запросы для «умных» колонок, так и записи из телефонных каналов. В коротких запросах она допускает на 20-35% меньше ошибок в словах, чем такие решения, как NeMo-Conformer-RNNT и Whisper-Large-v3, сообщили в SberDevices.
  • Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.
  • Улучшенные версии доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Пользователи последнего могут опробовать решения в повседневных задачах: распознать запись совещания или лекции в вузе.
SberDevices представила семейство моделей машинного обучения для распознавания русскоязычной речи и эмоций
1313
реклама
разместить
56 комментариев

Комментарий недоступен

2

Комментарий удалён модератором

И как он распознает какая эмоция вложена в слова «ну за*бись»? Или посчитает глаголом в повелительном наклонении?

2

Такое даже я не всегда могу понять ((

4

Контекст

Раскрывать всегда
Вложили 1,5 млн рублей в кондитерский отдел — закрылись через 4 месяца с долгом в 350 000

История пары из Москвы, которая решила вместо свадебного путешествия вложиться в кондитерский бизнес. О том, как ребята подходили к расчетам инвестиций, выбору помещения и почему у них всё пошло не по плану, читайте в нашей новой статье.

Фото не нашего отдела, но у нас было что-то похожее на этот
2020
Я ненавижу вашу техподдержку: как потерять клиента за один час

Разбираемся, почему именно техподдержка виновата в том, что вы потеряли клиента.

Я ненавижу вашу техподдержку: как потерять клиента за один час
2424
Метод Кирпича в маркетинге: основательность, которая строит успех годами

В мире маркетинга, где тренды часто меняются, а стратегии могут быть сиюминутными, метод Кирпича выделяется своей устойчивостью и долгосрочной ориентацией. Это подход, который напоминает строительство здания: кирпич за кирпичом, шаг за шагом. Но почему он получил такое название, и кто такие «кирпичные люди»? Давайте разбираться.

Метод Кирпича в маркетинге: основательность, которая строит успех годами
33
22
«Газпром» на фоне убытков ждёт реструктуризация, её возглавляет местная «Серсея Ланнистер» Елена Илюхина — FT

Её план как замгендиректора должен «расшевелить болото».

Источник фото: РБК
5252
55
55
22
22
11
Сделать убыточным Газпром надо постараться конечно...
На сайте Apple появился компьютер Lumon Terminal Pro из сериала Apple TV+ «Разделение» — фанаты расстроены, что его нельзя купить

К их сожалению, это всего лишь рекламная кампания стриминга.

Источник фото: Apple — здесь и далее
1818
44
11
Проект same.new выпустил генератор сайтов по текстовому описанию — его ИИ-агент может скопировать существующий интерфейс по ссылке

Сервис поддерживает русский язык.

2121
77
22
11
11
Еще один кол в джунов, которые хотят упасть на 400к после двухнедельных курсов скиллбокса
Зачем придумывать дизайн без брифа? Как я получила награду на международном фестивале Pentawards
Зачем придумывать дизайн без брифа? Как я получила награду на международном фестивале Pentawards
Как я превратила личную драму в миллионный бизнес: Секрет "невидимой" платформы, где женщины плачут и покупают

«Два года назад я была мамой в декрете с долгами и нулём на счету. Сегодня мой закрытый «островок доверия» собирает тысячи женских историй, а рекламодатели платят за доступ к аудитории. Расскажу, как стартовала с бюджетом 500К и окупила вложения за полгода»

Как я превратила личную драму в миллионный бизнес: Секрет "невидимой" платформы, где женщины плачут и покупают
99
22
11
11
11
11
Не только поисковики: как технологии ускоряют процесс трудоустройства

Рассказываем, как с помощью ИИ (и не только) упростить поиск работы и прохождение собеседований.

Не только поисковики: как технологии ускоряют процесс трудоустройства
3333
реклама
разместить
День 1128: Минпромторг вместе с «Яндексом» и «Сбером» разрабатывают единый стандарт ПО для промышленных роботов

Собираем новости, события и мнения о рынках, банках и реакциях компаний.

Фото «РИА Новости» 
66
55
22
Илон Маск подтвердил запуск чат-бота Grok в Telegram

Ранее на релиз намекал основатель мессенджера Павел Дуров.

Источник фото: Bloomberg
3232
1515
44
33
22
22
11
11
"доступен бесплатно владельцам платной подписки" я так ржал