LEMAS TTS - новая модель синтеза речи, поддерживающая русский язык

Появилась еще одна tts с поддержкой русского языка. Построена поверх f5 с изменениями, отличия от f5 можно почитать в их paper: https://arxiv.org/abs/2601.04233

Поддерживает 10 языков:
- Chinese
- English
- Spanish
- Russian
- French
- German
- Italian
- Portuguese
- Indonesian
- Vietnamese

Представлено 2 варианта весов, базовая модель и prosody вариант, который понимает извлеченные из референса просодии.

По качеству синтеза на русском, мне кажется хуже файтюнов f5 от misha24-10 и ESpeech.
Конечно же в тг комментариях можно послушать примеры.

Но это не все, в релизе есть еще такая штука - система редактирования речи.
Она позволяет заменять отдельные слова или предложения в речи.

Можно сделать свой вариант fabric details, пример в тг комментариях.

Подписывайтесь на Telegram – xVibeNot

Начать дискуссию