Убрать шум, слова-паразиты и тишину: нейросети для улучшения качества звука
Собрали пять сервисов, которые подойдут для обработки подкаста или звуковой дорожки для видео и не исказят русскоязычную речь.
Для проверки сервисов использовали отрывок из сериала «Вампиры средней полосы» режиссера Антона Маслова. Специально записали диалог так, чтобы на фоне были слышны звуки воды, порывы ветра и шуршание микрофона.
Audo Studio
Цена. Бесплатно обработает до 20 минут аудио в месяц. Подписка 一 от $12 в месяц (~943 рублей). Оплатить картой российского банка не получится.
Форматы. AMR, ASF, FLAC, FLV, M4A, MP3, MPEG, MPG, OGG, WAV, WEBM, WMA, WMV, MP4, MOV, MKV, AVI.
Регистрация. Через аккаунты Google и Github.
Демо-версия сервиса убирает шумы и выравнивает громкость речи. В будущем разработчики обещают добавить функцию для удаления эха. К результатам теста претензий нет 一 на обработку ушло секунд 15, голос актрисы не изменился, а шумы исчезли.
LALAL.AI
Цена. Бесплатно обработает до десяти минут аудио, дальше 一 от €6,75 в месяц (~616 рублей). Экспортировать результат обработки в аудиоформате можно только с платной подпиской.
Форматы. MP3, WAV, FLAC, OGG, AIFF, and AAC.
Регистрация. Через почту, аккаунты Google, Apple или Facebook (принадлежит запрещённой в России Meta).
Доступ. Приложение для MacOS и Windows, мобильная версия в App Store и Google Play.
В LALAL.AI есть несколько инструментов: можно отделить вокальную и инструментальную дорожки, изменить голос или клонировать его.
Для улучшения качества звука нужен инструмент Voice Cleaner («Очистить голос»). Нашу аудиозапись «очистить» удалось: шумы и завывание ветра на фоне исчезли, а интонации и узнаваемость голоса сохранились. Из минусов 一 сам голос всё ещё звучит так, будто его перезаписали с одного устройства на другое.
Adobe Podcast
Цена. Бесплатно обрабатывает до часа аудио в день (поддерживает файлы весом до 500 МБ). Premium-подписка стоит $9,99 (~785 рублей в месяц), с ней можно обрабатывать до четырёх часов контента ежедневно.
Форматы. WAV, MP3, M4A, AAC, FLAC, OGG, MP4, MOV, M4V.
Регистрация. Авторизоваться можно через аккаунты Google, Apple, Microsoft, Line, Kakao или Facebook (принадлежит запрещённой в России Meta).
Доступ. В браузере (интерфейса на русском языке нет).
Сервис убирает шумы на фоне, поддерживает аудио- и видеоформаты. Из плюсов 一 наш отрывок нейросеть обработала за 20 секунд, ветер и другие шумы убрала. Голос актрисы звучит так, словно запись делали в профессиональной студии. Но есть и минус: от исходных интонаций почти ничего не осталось, речь больше похожа на генерацию.
Auphonic
Цена. Обработает до двух часов контента в месяц бесплатно. Подписка — от $11 в месяц (~864 рублей).
Форматы. WAV, AIFF, FLAC, MP3, OGG, MP4, M4A, M4B, AAC, ALAC, CAF, AC3, MP2, 3GP.
Регистрация. Через аккаунты Google, Apple.
Доступ. Приложение для ПК, мобильное приложение в Google Play и App Store, браузерная версия.
Перед началом работы можно выбрать нужный режим — например, убрать все фоновые шумы или оставить музыку, убрать слова-паразиты в речи, запинки или паузы). Наш отрывок после обработки звучит естественно: в речи сохранились «человеческие» интонации, голос актрисы узнаваем. При этом на первых секундах кажется, что звук идёт откуда-то издалека. Главный минус 一 в бесплатной версии приложения после каждого обработанного аудио появится аудиовставка с рекламой, но её можно обрезать в бесплатных онлайн-сервисах.
Cleanvoice AI
Цена. Бесплатно обработает 30 минут контента, подписка стоит от $11 (~864 рублей) в месяц за десять часов аудио.
Форматы. MP3, WAV, OGG, M4A, MP4. Можно загрузить ссылку на аудио или видео, включить микрофон и надиктовать текст прямо в браузере.
Регистрация. По почте.
Сервис убирает из записи слова-паразиты, фоновый шум, тишину, звуки дыхания. По заявлению разработчиков, поможет добиться студийного звучания для любой аудиозаписи.
Тестовый отрывок сервис обработал за 30 секунд: звуки на фоне исчезли, но при этом голос актрисы всё ещё звучит так, словно она говорит в плохой микрофон — с помехами. Зато естественные интонации сохранились.