Ваня Юницкий

Text to speech модель, которая звучит хорошо

MiniMax на днях выкатили Speech 2.5:

Text to speech модель, которая звучит хорошо

- 40 языков от тамильского до африканского, с сохранением акцентов.

Клонирование голоса крутого уровня: тембр, возраст, эмоции, паузы. Все в точности как в оригинале.
Больше естественных интонаций, особенно в английском и китайском (разумеется).

Доступно в веб-песочнице MiniMax Audio и через API.

Подписывайтесь на Telegram Точки над ИИ.

1