Text to speech модель, которая звучит хорошо

MiniMax на днях выкатили Speech 2.5:

Text to speech модель, которая звучит хорошо

- 40 языков от тамильского до африканского, с сохранением акцентов.

  • Клонирование голоса крутого уровня: тембр, возраст, эмоции, паузы. Все в точности как в оригинале.
  • Больше естественных интонаций, особенно в английском и китайском (разумеется).

Подписывайтесь на Telegram Точки над ИИ.

1
1 комментарий