Если в вашем юзкейсе люди делают очень много пауз, то странно требовать кастомизации бесплатного пу…

Alexander Veysov

Трибуна

25.11.2021

Telegram-бот Silero бесплатно переводит речь в текст

8181

Roman No

26.11.2021

Нормализация аудио может работать лучше -иногда на записи один собеседник говорит тихо, а второй -нормально. Тихий сигнал-принимается за шум и на выходе - монолог Гамлета. Можно бы нормализовать кусочек «шума» до более высоких значений и распознать его повторно -вдруг там что-то есть. Еще смешивает собеседников -по факту часто неверно разделяет

Ответить

Roman No

26.11.2021

стандартная функция «нормализации не работает в таком разе, нужно резать на куски и отдельно нормализовать. ps анализировались диктофонные записи, шума постороннего практически нет; речь хорошо различима при нормализации до 300%

Ответить