Вчера вышел SAM Audio, моделька которая умеет вырезать конкретные звуки из видео.
Для изоляции звука существуют Adobe Audition, iZotope RX, Spleeter. Это работает давно.
SAM Audio просто хотят сделать удобнее — отделять любой звук от любого аудио или видеофайла с помощью промпта.
Три типа для изоляции звука:
• Текст: пишешь лай собаки или гитара, модель вырезает
• Видео: кликаешь на человека/объект в кадре, получаешь его звук
• Временные отрезки: выделяешь участки времени где нужный звук (первая такая реализация в индустрии)
Модель доступна для скачивания, есть плейграунд где можно тестить на своих файлах.
Подписывайтесь на Telegram Tips AI | IT & AI.
Начать дискуссию