Text to speech модель, которая звучит хорошо
MiniMax на днях выкатили Speech 2.5:
- 40 языков от тамильского до африканского, с сохранением акцентов.
- Клонирование голоса крутого уровня: тембр, возраст, эмоции, паузы. Все в точности как в оригинале.
- Больше естественных интонаций, особенно в английском и китайском (разумеется).
Доступно в веб-песочнице MiniMax Audio и через API.
Подписывайтесь на Telegram Точки над ИИ.
1 комментарий