Meta выпустила «ножницы для вселенной»: как SAM 3 разрежет мир на кусочки и соберет заново в 3D
Новая модель от Цукерберга может выделить любой объект на фото или видео и превратить его в трехмерную модель. Это меняет правила игры для дизайнеров, геймдева и даже мебельщиков.
Помните, как в детстве вырезали картинки из журналов? Теперь это может делать ИИ — причем превращая плоские изображения в объемные модели. Meta представила SAM 3 — третью версию модели, которая умеет «сегментировать» мир, и два дополнения для работы с 3D.
SAM 3: Ножницы 2.0
Что умеет:
- Выделять объекты на фото и видео по текстовому описанию
- Работать с геометрией — отмечать точки «включить» или «исключить»
- Обгонять конкурентов на тестах по точности сегментации
Практическое применение: Пользователи Facebook Marketplace уже могут «примерить» мебель в своей комнате через AR. SAM 3 делает это возможным.
SAM 3D: Из 2D в 3D за секунды
Самое интересное начинается дальше:
- Превращает маски из SAM 3 в трехмерные объекты
- Люди предпочитают его результаты в 80% случаев против конкурентов
- Работает с облаками точек для улучшения детализации
Пример: Сфотографировали диван → SAM 3 выделил его → SAM 3D сделал 3D-модель → можете посмотреть, как он будет выглядеть в гостиной.
SAM 3D Body: Люди в 3D
Отдельная модель для работы с людьми:
- Создает 3D-фигуры из изображений
- Уточняет положение рук — самая сложная часть для ИИ
- Превосходит специализированные модели по точности
Секрет успеха: Meta использовала хитрый подход — находила примеры, где модель ошибалась, поручала людям их разметить, и дообучала модель. Это резко сократило время и стоимость создания качественных данных.
Кому это нужно?
- Дизайнеры интерьеров — мгновенная 3D-визуализация
- Разработчики игр — быстрый перенос реальных объектов в виртуальные миры
- Архитекторы — создание моделей из фотографий
- Э-commerce — виртуальные примерочные и мебельные шоурумы
Конкуренты не дремлют
Пока Meta работает с отдельными объектами, World Labs запустила Marble — систему для создания целых 3D-пространств.
- Генерирует миры из текста, изображений или видео
- Редактируется через текстовые запросы
- Экспортируется в форматы для игровых движков
Фэй-Фэй Ли, основатель World Labs: «Пространственный интеллект — ключевой аспект разума, который языковые модели не могут полностью охватить».
Что это значит для бизнеса?
- Снижение затрат на 3D-моделирование в десятки раз
- Ускорение процессов разработки и дизайна
- Новые продукты на стыке реального и виртуального миров
Мы стоим на пороге революции в создании цифрового контента. Скоро любой сможет сделать 3D-модель чего угодно — от чашки на столе до целого города. Те, кто освоит эти инструменты первыми, получат огромное преимущество. Остальные будут покупать у них услуги.