ElevenLabs представила Flash v2.5 с поддержкой русского языка

Бесплатно можно ввести 10 тысяч знаков в месяц.

Новые модели Flash v2 и Flash v2.5 озвучивают текст за 75 миллисекунд, рассказали в компании. При этом v2 поддерживает только английский язык, а v2.5 — 32 языка, включая русский.
ElevenLabs предлагает использовать модели с низкой задержкой для создания голосовых помощников, которые смогут поддерживать «естественный ритм» диалога, и для озвучивания игровых персонажей.
Модель смогла сгенерировать аудио для 60 символов на русском языке меньше чем за две секунды, ниже можно послушать результат.

Скринкаст vc.ru

Найти ИИ-агента, который адаптирован для русского или других языков, можно в библиотеке голосов. В строке поиска нужно ввести язык и выбрать понравившийся голос из списка кнопкой Add.

Модель Flash можно протестировать на платформе ElevenLabs для создания ИИ-агентов (не доступно с российских IP-адресов). Бесплатно дают 10 тысяч кредитов в месяц. Платная подписка начинается от $5 в месяц (510 рублей по курсу ЦБ на 19 декабря 2024 года), в ней уже от 30 тысяч кредитов и лицензия на использование голосов в коммерческих целях.
ElevenLabs основали в 2022 году бывший ML-инженер Google Пётр Дабковски и бывший разработчик стратегий развёртывания Palantir Мати Станишевски. Стартап стал известен благодаря функции «нейродубляжа» видео на разные языки. В июне 2023 года его оценивали в $100 млн. В январе 2024-го — в $1,1 млрд.