Вчера вышел SAM Audio, моделька которая умеет вырезать конкретные звуки из видео.

Для изоляции звука существуют Adobe Audition, iZotope RX, Spleeter. Это работает давно.

SAM Audio просто хотят сделать удобнее — отделять любой звук от любого аудио или видеофайла с помощью промпта.

Три типа для изоляции звука:

• Текст: пишешь лай собаки или гитара, модель вырезает

• Видео: кликаешь на человека/объект в кадре, получаешь его звук

• Временные отрезки: выделяешь участки времени где нужный звук (первая такая реализация в индустрии)

Модель доступна для скачивания, есть плейграунд где можно тестить на своих файлах.

Подписывайтесь на Telegram Tips AI | IT & AI.

1
Начать дискуссию