Alibaba выпустила модель Qwen3-TTS для озвучки текста с поддержкой русского языка

Компания опубликовала бесплатную демоверсию и добавила модель в API.

Она может озвучивать диалоги на нескольких языках одновременно. Источник: Alibaba
  • Модель поддерживает десять языков, включая английский, китайский, японский, корейский, немецкий, итальянский, французский и русский. Доступно 17 голосов с разными тембрами и «эмоциями».

Пример генерации с помощью голоса Sunny.

Голос Rocky.

  • Qwen3-TTS-Flash можно протестировать бесплатно в демоверсии на HuggingFace. Работа с моделью в API от Alibaba стоит $0,1 за озвучивание 10 тысяч символов (около 8 рублей по курсу ЦБ на 23 сентября 2025 года).
Сравнение результатов Qwen3-TTS-Flash с конкурентами в генерациях на разных языках. Источник: Alibaba
Сравнение результатов Qwen3-TTS-Flash с конкурентами в генерациях на разных языках. Источник: Alibaba
7
4
3
2
33 комментария