Первая открытая стриминг TTS

Nari Labs выпустили Dia2 - первую open-source TTS-модель со стриминговой генерацией в реальном времени. Не нужен полный текст, начинает синтезировать с первых слов.
Две версии: 1B и 2B параметров, полностью открыты для коммерческого использования.
Умеет только в английский язык, но интересен сам факт публикации такой модели.

Подписывайтесь на Telegram – xVibeNot

Начать дискуссию