Кейс: как я сделала студийный звук для аудиокниги с помощью нейросетей
Когда я начинала работу над аудиокнигой, у меня был только диктофон в iPhone и огромное желание. Ни профессиональной студии, ни дорогого микрофона, ни опыта в сведении звука. Казалось, что без всего этого запись не будет звучать достойно.
Я попробовала Auphonic — сервис, где нейросеть берёт на себя постобработку звука. ИИ автоматически чистит шумы, выравнивает громкость, убирать резкие пики. По сути, делает ту самую рутинную работу, на которую обычно уходят часы работы, за считанные минуты.
И вот тут началось самое интересное.
Сложность
Сразу после обработки запись звучала идеально: никаких шумов, никаких «лишних» дыханий, всё очень ровно и гладко. Слишком ровно.
Аудиокнига — это не подкаст, где важно, чтобы голос просто был чётким. В книге диктор играет разных персонажей, меняет тембр, интонацию, добавляет эмоции. И вот эту окраску Auphonic частично «съедал» — голос становился безжизненным, будто «выглаженным утюгом». Чисто, но слишком стерильно.
Я поняла, что так слушать долго невозможно: уходит «живое дыхание» текста.
Решение
Я решила подключить GPT как «консультанта по звуку». У меня не было опыта работы с терминами вроде LUFS, True Peak или Adaptive Leveler, но я могла описывать, что слышу:
- «Звук стал слишком плоским»
- «Пропали низкие обертоны»
- «Хочется больше теплоты»
GPT помогал перевести эти ощущения в технические параметры. Так мы шаг за шагом подобрали настройки обработки, которые оставляют голос естественным, но при этом дают ощущение студийного качества.
Вот финальный набор, который сработал:
Что получилось
Обычная запись на iPhone стала звучать так, будто я читала в профессиональной студии. Но при этом голос остался живым: слышно дыхание, обертоны, эмоции. Персонажи не сливаются в «одну ровную дорожку», а сохраняют индивидуальность.
Вывод: нейросети не убивают творчество, а наоборот — освобождают место для него. Ты остаёшься в роли рассказчика и актёра. Диктор — это душа аудиокниги, а Auphonic и GPT — это просто инструменты, которые берут на себя рутину.
Кому это пригодится
- Авторам аудиокниг, которые пишут дома и боятся, что «не потянут студийный звук».
- Подкастерам, которым хочется меньше времени тратить на монтаж.
- Всем, кто работает со звуком, но не любит ковыряться в десятках ползунков и терминов.