Alibaba выпустила модель Qwen3-TTS для озвучки текста с поддержкой русского языка
Компания опубликовала бесплатную демоверсию и добавила модель в API.
Она может озвучивать диалоги на нескольких языках одновременно. Источник: Alibaba
- Модель поддерживает десять языков, включая английский, китайский, японский, корейский, немецкий, итальянский, французский и русский. Доступно 17 голосов с разными тембрами и «эмоциями».
Пример генерации с помощью голоса Sunny.
Голос Rocky.
- Qwen3-TTS-Flash можно протестировать бесплатно в демоверсии на HuggingFace. Работа с моделью в API от Alibaba стоит $0,1 за озвучивание 10 тысяч символов (около 8 рублей по курсу ЦБ на 23 сентября 2025 года).
Сравнение результатов Qwen3-TTS-Flash с конкурентами в генерациях на разных языках. Источник: Alibaba
33 комментария