ElevenLabs выпустила Flash v2.5 с «самой низкой задержкой» озвучивания текста среди моделей компании и поддержкой русского языка

Бесплатно можно ввести 10 тысяч знаков в месяц.

1010
55
11

Звучит многообещающе, но пока это только начало. Хотелось бы увидеть больше информации о качестве голосов, особенно при длительном прослушивании. И как насчет эмоциональной окраски? Смогут ли модели передавать разные эмоции?

Полезно было бы использовать такие технологии, например для создания аудиокниг или озвучивания мультфильмов. Судя по тому, как ИИ развивается, мы еще и не такое увидим))

1

больше информации о качестве голосов, особенно при длительном прослушиванииА что при длительном прослушивании? Нейросеть не устает. Нейросеть не теряет качество на долгой дистанции

И как насчет эмоциональной окраски? Смогут ли модели передавать разные эмоции?Давно уже

так зайдите на сайт послушайте