LEMAS TTS - новая модель синтеза речи, поддерживающая русский язык
Появилась еще одна tts с поддержкой русского языка. Построена поверх f5 с изменениями, отличия от f5 можно почитать в их paper: https://arxiv.org/abs/2601.04233
Поддерживает 10 языков:
- Chinese
- English
- Spanish
- Russian
- French
- German
- Italian
- Portuguese
- Indonesian
- Vietnamese
Представлено 2 варианта весов, базовая модель и prosody вариант, который понимает извлеченные из референса просодии.
По качеству синтеза на русском, мне кажется хуже файтюнов f5 от misha24-10 и ESpeech.
Конечно же в тг комментариях можно послушать примеры.
Но это не все, в релизе есть еще такая штука - система редактирования речи.
Она позволяет заменять отдельные слова или предложения в речи.
Можно сделать свой вариант fabric details, пример в тг комментариях.
Подписывайтесь на Telegram – xVibeNot