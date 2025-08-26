Компания выложила её бесплатную демоверсию и открытый исходный код. Исследовательское подразделение Microsoft представило модель для создания аудио длиной до 90 минут по текстовым запросам — сценарию и прописанным репликам. Её позиционируют как генератор подкастов.VibeVoice может добавить до четырёх персонажей в одну запись. Пока инструмент поддерживает английский и китайский языки.Пример сгенерированного подкаста с фоновой музыкой.Пример «эмоционального» разговора между двумя персонажами.Компания выложила бесплатную демоверсию модели. В полученные результаты добавляют предупреждение, что аудио сгенерировала нейросеть.Также доступны код и веса двух версий: VibeVoice-1.5B с контекстным окном в 64 тысячи токенов и длиной вывода до 90 минут и VibeVoice-7B — с контекстом в 32 тысячи токенов и выводом до 45 минут.#новости #microsoft