Математики из Армении создали сервис, который убирает посторонние звуки во время звонков

С помощью нейросетей Krisp определяет раздражающие шумы (вроде плача ребёнка или шуршания бумаги) и в реальном времени вырезает их из аудиопотока.

Интерфейс Krisp
209209

Главный вопрос — где взяли столько датасетов для голоса. Прям очень интересно, потому что "записали датасеты в студии" звучит не очень реалистично :)

4
Ответить

1.Сами записывали
2. voice recording datasets( LibriSpeech, TIMIT)
3. Секретный ингредиент ( об этом не могу рассказать )

4
Ответить