{"id":14274,"url":"\/distributions\/14274\/click?bit=1&hash=fadd1ae2f2e07e0dfe00a9cff0f1f56eecf48fb8ab0df0b0bfa4004b70b3f9e6","title":"\u0427\u0435\u043c \u043c\u0443\u0440\u0430\u0432\u044c\u0438\u043d\u044b\u0435 \u0434\u043e\u0440\u043e\u0436\u043a\u0438 \u043f\u043e\u043c\u043e\u0433\u0430\u044e\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0441\u0442\u0430\u043c?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"6fbf3884-3bcf-55d2-978b-295966d75ee2"}

Google выпустила набор из 15 тысяч видео с разными предметами, чтобы обучать алгоритмы ML лучше распознавать 3D-объекты Статьи редакции

Набор открыт для всех.

Google AI выпустила Objectron — набор коротких видеоклипов с объектами, снятыми с разных ракурсов. В компании считают, что он поможет исследователям в тренировке моделей машинного обучения — лучше распознавать 3D-объекты.

Objectron доступен на GitHub. Он содержит 15 тысяч размеченных видео и 4 млн размеченных изображений с метаданными, они сняты в десяти странах на пяти континентах.

Аннотации описывают положение, ориентацию и размеры каждого объекта. Клипы сопровождаются AR-метаданными: позицией камеры, облаком точек и характеристикой плоских поверхностей.

Набор включает видео с велосипедами, книгами, бутылками, фотоаппаратами, стульями и ноутбуками

«По сравнению с 2D-задачами понимание объёмных объектов остаётся сложной проблемой, поскольку больших наборов реальных данных просто нет», — объяснили в Google AI. Распознавание геометрии трёхмерных объектов — один из ключей для развития приложений в дополненной реальности, робототехнике, автономии и поиске изображений.

Вместе с набором Google AI поделилась решением для обнаружения 3D-объектов в четырёх категориях:

  1. Обувь.
  2. Стулья.
  3. Кружки.
  4. Фотоаппараты.

Модели обучаются с помощью данных Objectron и работают на MediaPipe, фреймворке Google с открытым исходным кодом для кросс-платформенных ML-решений.

Google также открыла конвейер для анализа данных во фреймворках Tensorflow, PyTorch и Jax. Подробные инструкции по загрузке данных и работе с ними опубликованы на GitHub.

0
4 комментария
Pavel Sharonov

Хороший подход в расчете на поиск новичков, которые изобретут новые методики распознавания объектов, действуя по принципу "а мы не знали что так нельзя"...

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
hakhagmon

отлично подходит к посту вк про phpk 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
1 комментарий
Раскрывать всегда