Дополнение к прошлому посту
Text-to-speech модели, которые теоретически скоро появятся:
Orpheus-TTS
Клонирование голоса: ✅
Реалтайм: ✅
RTF: не тестил
Пишут что хороший реалтайм, русский не поддерживает.
Готовится файнтюн:
https://huggingface.co/papacliff/orpheus-3b-0.1-ft-ru
Есть готовый сетап под low latency streaming:
https://github.com/taresh18/orpheus-streaming
CosyVoice 3
Но веса не публиковали, доступна только CosyVoice 2, без поддержки русского.
Подписывайтесь на Telegram – xVibeNot
Начать дискуссию