Microsoft VibeVoice: генерация речи из текста в реальном времени

Microsoft выпустили модель VibeVoice для генерации речи из текста в режиме реального времени.

VibeVoice позволяет создавать длинные диалоги сразу с несколькими участниками, виртуальные голоса даже умеют петь. Можно взять любой текст и сгенерировать часовой подкаст.

Тестируем здесь.

Подписывайтесь на Telegram NN.

Начать дискуссию