Технические подробности создания подкаста D00M4ACE с использованием только локальных нейронных сетей

В видеоролике YouTube "Технические подробности создания подкаста D00M4ACE с использованием только локальных нейронных сетей" (Technical Details of Creating the D00M4ACE Podcast with Only Local Neural Networks), D00M4ACE рассказывает о создании своего подкаста D00M4ACE с использованием локальных нейронных сетей. D00M4ACE объясняет, что обрабатывает каждый блок подкаста отдельно и используют набор данных для создания контента. D00M4ACE подчеркивает важность работы с локальными нейронными сетями и рассказывает о своем рабочем процессе, в том числе об использовании специальных функций, таких как "заменить любые цифры" для локализации текста. D00M4ACE также рекомендует использовать программу Text-to-Speech (TTS) под названием Coqui TTS Studio и XTTS v2.0 для генерации голосов подкастов и обученных контрольных точек для нейронных сетей Думфэйс и Шахерезада. D00M4ACE демонстрирует процесс создания сценария на английском языке, его перевод на русский и разбивку на фразы для удобства редактирования. D00M4ACE также обсуждает исторический контекст языка и компьютеров и выражают благодарность аудитории за поддержку.

UPDATE:

На выходных я немного улучшил озвучку в TTS, и теперь она может четко произносить любые иностранные слова, например, компании или продукты, такие как ChatGPT, AWS, FTP, Azure и тп. Улучшил трансляцию дат, цен и всех чисел в TTS. Это определенно улучшит информативность. Почистили набор датасета голоса Шахерезады и переобучили сетку в RVC, теперь она не так фонит, как раньше. Послушать новый образец мини-подкаста, в котором все это было, вы теперь можете сами.

WARNING:

Есть проблема со звуком в этом видео, да давно микрофон не проверял, но думаю это не проблема)

LINKS:

D00M4ACE разработка 2D MMORPG блог ИИ и геймдев 🌐 https://d00m4ace.com

33
Начать дискуссию