В T-Bank AI Research создали самый точный метод распознавания неизвестных объектов

Эффективность подтвердили на наборах данных от Стэнфордского университета и университета Торонто.

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали самый точный в мире метод по обнаружению ранее неизвестных объектов на фото с помощью ИИ. Это подтверждают общепринятые в области компьютерного зрения наборы данных, которые создали Стэнфордский университет и университет Торонто — CIFAR10/100 и ImageNet. Метод был создан совместно со студентами Университета МИСИС и МФТИ.

Метод получил название SDDE (Saliency-Diversified Deep Ensembles) и будет особенно востребован в сферах, где требуется высокая точность анализа изображений. Например, в области беспилотных транспортных средств и медицинской диагностики. То есть там, где важно различать неопознанные элементы и графические артефакты.

Новый метод снизил риск ошибки при обработке и анализе изображений более чем на 20%, а значит требуется меньше человеческих усилий для перепроверки результатов и исправления неверных решений.

Открытие признано мировым научным сообществом и было представлено на Международной конференции по обработке изображений (IEEE ICIP) в Абу-Даби, ОАЭ. Это одна из крупнейших научных конференций, посвященных обработке изображений и видео, а также компьютерному зрению.

Компьютерное зрение (CV) — это область искусственного интеллекта, которая занимается анализом изображений и видео. Для повышения эффективности распознавания объектов ученые применяют методы машинного обучения. В частности, метод «глубокие ансамбли», который объединяет несколько нейронных сетей для решения задачи. Это похоже на сбор мнений разных экспертов для получения лучшего решения.

Предыдущие разработки в области CV сталкивались с проблемой однородности ансамблей. Они были слишком похожи друг на друга, а значит снижалось качество и разнообразие их оценок.

Для того чтобы идентификация объектов была более надежной в новом методе SDDE мы используем карты внимания, фокусирующиеся на разных аспектах данных. Модели стали более разнообразными, а их общая точность повысилась.

Также мы научили модель при работе с изображениями учитывать не только те наборы данных, которые использовались при ее обучении, но и незнакомую ей информацию. Такой подход значительно улучшил работу модели в области обнаружения ранее неизвестных ей объектов и точности их распознавания.

Для оценки эффективности метода мы провели испытания на популярных базах данных: CIFAR10, CIFAR100 и ImageNet-1K. Метод SDDE продемонстрировал наилучшие результаты по сравнению со схожими алгоритмами, такими как Negative Correlation Learning и Adaptive Diversity Promoting.

Даниил Гаврилов, руководитель лаборатории T-Bank AI Research:

«Эта статья является продолжением серии наших работ, посвященных робастности и безопасности искусственного интеллекта. Мы сосредоточены на разработке методов, которые повышают устойчивость ИИ-систем к незнакомым или неожиданным данным, что критически важно для надежного применения ИИ в различных сферах. Наш новый подход с использованием Saliency-Diversified Deep Ensembles (SDDE) представляет значительный шаг вперед в обеспечении безопасности и точности ИИ-технологий. Мы первыми использовали карты внимания (saliency maps) для диверсификации моделей, что позволило существенно улучшить обнаружение и обработку данных вне распределения».

Подробное описание модели и результаты экспериментов доступны в статье Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy.

В T-Bank AI Research создали самый точный метод распознавания неизвестных объектов

Неизвестное становится известным

Карты внимания