В том-то и дело. Мы не работаем с речью.Krisp убирает шумы, а они не привязаны к языку.

Математики из Армении создали сервис, который убирает посторонние звуки во время звонков

С помощью нейросетей Krisp определяет раздражающие шумы (вроде плача ребёнка или шуршания бумаги) и в реальном времени вырезает их из аудиопотока.

209209

Главный вопрос — где взяли столько датасетов для голоса. Прям очень интересно, потому что "записали датасеты в студии" звучит не очень реалистично :)

Ответить

1.Сами записывали
2. voice recording datasets( LibriSpeech, TIMIT)
3. Секретный ингредиент ( об этом не могу рассказать )

Ответить