NTA

Опыт участия в Data Science соревновании на платформе Kaggle в области компьютерного зрения (Object Detection)

Нашей задачей было распознавание платёжной системы на изображениях банковских карт (Object detection). Метрикой качества в нашей задаче было расстояние Левенштейна – критерий, измеряющий по модулю разность между двумя последовательностями символов. Более подробно про метрику можно почитать здесь.

Датасет

Выборка представляла собой 2000 тренировочных изображений с размеченными платежными системами и 1000 тестовых изображений. В нашем датасете присутствовало 6 различных платёжных систем: MasterCard (MA), Visa (VI), Union Pay (UY), МИР (PC), American Express (EX), Maestro (ST).

Решение

Для решения данной задачи я использовал фреймворк глубокого обучения Pytorch, а также библиотеки Albumentations, Skimage и ImgAug.

В качестве модели я взял предобученную Faster RCNN на основе ResNet50 и немного дообучил её под нашу задачу. Принцип работы и характеристики модели можно посмотреть тут и тут.

Первым делом я посмотрел на распределение лейблов в нашей выборке:

Как видно из графика, распределение довольно неравномерное. В нашей выборке мало изображений, на которых присутствуют следующие лейблы: Union Pay (UY), МИР (PC), American Express (EX), Maestro (ST). Поэтому я попробовал немного изменить баланс наших классов. Для этого, используя библиотеки ImgAug и Skimage, я добавил в нашу выборку новые изображения с редкими лейблами, полученные из исходных с помощью поворотов на определенные углы (от -120 до 120 градусов с шагом в 30 градусов), на некоторые из них также добавил размытие.

В итоге я получил такое распределение:

Так как изображения в нашем датасете разного размера, я привёл их к максимальному размеру, который принимает наша модель (1333 на 1333 пикселя).

Также я добавил следующие аугментации для всех изображений с помощью библиотеки Albumentations:

В качестве оптимизатора я использовал AdamW с WarmUp и LrSceduler.

Гиперпараметры я подбирал по валидации. Порог уверенности (Treshold) выбрал после обучения с помощью валидационной выборки, для этого я перебрал значения от 0.5 до 1.0 с шагом 0.02. На картинке ниже представлен график зависимости расстояния Левенштейна на валидации от значения порога:

Ниже приведу пример работы данной модели на тестовой выборке:

Исходный код предоставляю по ссылке. Спасибо за внимание!

{ "author_name": "NTA", "author_type": "editor", "tags": [], "comments": 0, "likes": 2, "favorites": 0, "is_advertisement": false, "subsite_label": "newtechaudit", "id": 294431, "is_wide": true, "is_ugc": false, "date": "Fri, 17 Sep 2021 12:03:08 +0300", "is_special": false }
0
0 комментариев
Популярные
По порядку
Читать все 0 комментариев
Как найти кофаундеров для запуска NFT коллекции / ART Designer?
Как не попасть в карьерную ловушку тимлида: личный опыт

Кажется, что тимлиду просто некуда расти: дальше надо либо идти в менеджмент, либо наоборот, становиться узконаправленным разработчиком. По просьбе «Лаборатории Касперского» Евгений Мацюк, который прошел в компании неординарный путь, рассказал о своих карьерных развилках во время и после тимлидства, а также поделился опытом горизонтального роста.

Cloud CDN: что это такое, как устроено и кому нужно. Разбираем на примере бургеров

Cloud CDN — это сеть быстрой доставки статического контента в формате услуги облачного провайдера. Объяснить, как работает технология, проще всего на примере — сравнить Cloud CDN с популярным продуктом, который выглядит плюс-минус одинаково вне зависимости от того, заказали вы его в Москве, Питере или Нью-Йорке. Знакомьтесь: классический бургер.…

Детство на антибиотиках: как медицинский догматизм чуть меня не угробил, но, в итоге, подарил дело моей жизни

Часто, когда говорят или пишут о великих, упоминают, что еще в детстве они столкнулись с какой-то проблемой, решили спасти от нее весь мир и так стали тем, кем стали. С великими себя не сравниваю, но для меня такие биографии – свидетельство того, что если человеку нужно, он добьется всего, что захочет. У меня тоже есть подобная история за…

ПСБ запустил личный кабинет для предпринимателей. Там можно следить онлайн за каждым своим терминалом

Сервис предоставляется бесплатно.

Строит магазины без окон, чтобы люди теряли счёт времени и думали о покупках: как IKEA заставляет тратить больше Статьи редакции

Ежегодные продажи компании достигают $50 млрд, большая часть которых приходится на незапланированные покупки посетителей, рассказал журналист The Hustle Трунг Фан.

Покупательница магазина Campaignasia
Как OTUS стал платформой для самореализации. История преподавателя

Наш преподаватель, специалист по Data Science, решил поделиться своей историей преподавания. Он рассказал, как пришел в эту сферу, с какими трудностями столкнулся на пути к преподаванию и что ему помогает. А еще поделился советами, как поддерживать внимание студентов и сделать занятия полезными и увлекательными.

Geforce Now. Очереди более 30 минут, лаги и тормоза на платном тарифе
Госдеп США рекомендовал россиянам подавать документы на американскую иммиграционную визу в Варшаве Статьи редакции

Неиммиграционные визы посольство США в Москве рекомендовало оформлять в других странах.

Минэк и корпорация МСП предложили освободить малый бизнес от штрафов за первое нарушение КоАП Статьи редакции

Поправки должна рассмотреть правительственная комиссия, а в случае одобрения их внесут в Госдуму, рассказал источник.

7 причин начать пользоваться Bright Data Proxy Manager:
null