Отделить человеческий голос от шума, не было трудно и раньше. Проблема всех Skype, Slack и других VoIP-сервисов в потере пакетов, тайминги и компрессии звука.
Сам себе отвечу, если в основе лежит нелинейная оптимизация звуковых частот, с использованием кластеризации звуковых волн для фильтрации, то 15мс очень хороший результат... но вопрос теперь другой, отправляет ли новые данные это приложение себе в big data
А зачем там нужна нейросеть, в чем преимущество ?
Отделить человеческий голос от шума, не было трудно и раньше. Проблема всех Skype, Slack и других VoIP-сервисов в потере пакетов, тайминги и компрессии звука.
Сам себе отвечу, если в основе лежит нелинейная оптимизация звуковых частот, с использованием кластеризации звуковых волн для фильтрации, то 15мс очень хороший результат... но вопрос теперь другой, отправляет ли новые данные это приложение себе в big data