{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Лучшие платформы аннотирования изображений для компьютерного зрения на 2019 год

Мы постоянно находимся в поиске лучших платформ аннотирования, обеспечивающих широкую функциональность, имеющих инструменты управления проектами и оптимизацию процесса аннотирования (когда нужно аннотировать 50 тысяч изображений, важна экономия даже одной секунды на каждом).

На основании своего опыта работы с каждой из платформ мы делимся своими честными обзорами, надеясь, что они будут полезны дата-саентистам, которым необходимо вручную размечать свои данные.

Мы используем следующие критерии:

1. Цена

2. Разнообразие функций, инструментов и форматов

3. Управление проектами и простота использования

LabelImg — это инструмент для разметки изображений с открытым исходным кодом, имеющий готовые собранные файлы для Windows, благодаря чему его установка выполняется чрезвычайно быстро.

1. Цена: бесплатно

2. Функции: поддерживает только ограничивающие прямоугольники (также есть версия в формате RotatedRect и оптимизированная версия для одноклассовой разметки), но что-либо более сложное отсутствует. Используется формат PascalVoc XML, а файлы аннотаций сохраняются отдельно для каждого изображения в исходной папке.

3. Управление проектами: практически не имеет функций управления проектами, но позволяет удобно импортировать и визуализировать аннотации, а при необходимости и исправлять их. Простой офлайн-интерфейс ускоряет процесс аннотирования, однако он не поддерживает многих горячих клавиш.

VGG — это инструмент в open-source, который подобно LabelImg способен потрясающе справляться с простыми задачами, не требующими управления проектами. У него есть онлайн-интерфейс, а также его можно использовать офлайн как HTML-файл. В самой последней версии есть широкий выбор инструментов для разметки видео.

1. Цена: бесплатно

2. Функции: имеет гораздо больше инструментов, в том числе точки, линии, многоугольники, круги и эллипсы (единственная платформа в нашем списке с поддержкой кругов и эллипсов!). Также имеет опцию добавления атрибутов/тегов объектов и изображений. Аннотации можно скачивать как один файл JSON, содержащий все аннотации, или как один файл CSV; также их можно загружать обратно, если потребуется проверка.

3. Управление проектами: ничего особо изощрённого с точки зрения управления наборами данных и пользователями, но для аннотации многоугольниками интерфейс является одним из самых эффективных и точных, потому что он позволяет отображать только линию многоугольника и ничего более. Также поддерживаются некоторые горячие клавиши, а само приложение в целом очень легковесно.

Supervisely — это потрясающая веб-платформа, предоставляющая расширенный интерфейс аннотирования, а также обеспечивающая весь процесс обучения компьютерного зрения, в том числе и библиотеку моделей глубокого обучения, которые можно непосредственно обучать, тестировать и совершенствовать внутри платформы.

1. Цена: бесплатная общественная версия и корпоративные тарифы для версии с собственным хостингом

2. Функции: отличный набор инструментов, в том числе точки, линии, прямоугольники, многоугольники и пиксельные кисти для семантической сегментации (однако «умный» инструмент показался нам не особо полезным). Также существует возможность рисования отверстий в полигонах, оказавшаяся невероятно полезной. Ещё одной очень полезной функций стала опция добавления тэгов изображений и объектов для упорядочивания фигур в слоях. Вывод выполняется в файлах JSON для каждого изображения или в PNG-масках; также платформа позволяет загружать такие форматы, как Cityscapes и COCO. Кроме того, существует опция выполнения преобразования данных непосредственно на платформе.

3. Управление проектами: платформа предоставляет множество опций управления проектами на различных уровнях (команды, рабочие пространства, наборы данных) и управления аннотаторами (задачи разметки, допуски, статистика). Ещё есть язык Data Transformation Language и опция Python Notebooks для управления данными, которая была очень полезной. Не хватает статистики по времени и механизмов контроля качества. Отдел технической поддержки платформы всегда готов помочь в случае проблем. Интерфейс обеспечивает очень точную работу и поддерживает настраиваемые горячие клавиши, но иногда производительность бывает довольно низкой, что особенно раздражает, когда платформе требуется много времени на переключение между изображениями и запись аннотаций.

Labelbox — ещё одна отличная веб-платформа, запущенная в начале 2018 года и с тех пор постоянно обновляющая и улучшающая свои функции. Она также предлагает возможность интеграции живого оператора при помощи импорта прогнозов модели и наблюдения за консенсусом между разметчиками и моделью.

1. Цены: бесплатная общественная версия на 5000 изображений и корпоративная версия

2. Функции: полный набор инструментов аннотирования, в том числе точки, линии, прямоугольники и многоугольники, а недавно была добавлена потрясающая новая функция для кисти семантической сегментации — опция суперпиксельной раскраски, сильно упрощающая жизнь в случае чётких границ объектов (почти как этот и этот инструменты в open source). Вывод производится в один файл JSON или CSV, содержащий все аннотации, или в PNG-маски (однако для каждого класса есть только одна маска, поэтому пользователю необходимо придумывать, что потом делать с пересекающимися областями)

3. Управление проектами: подготовка проекта чрезвычайно проста, есть множество опций для мониторинга производительности, в том числе статистика по количеству секунд, необходимых для разметки изображения. Можно использовать множество механизмов контроля качества, в том числе активацию автоматического консенсуса между разными разметчиками или установку бенчмарков «золотого стандарта». Есть возможность приглашения пользователей (однако уровни доступа реализованы не очень гибко) и проверки работы каждого из них. Интерфейс разметки очень прост и поддерживает горячие клавиши (хоть и без возможности их настройки). В бесплатной версии отсутствует функция загрузки аннотаций для их визуализации или редактирования.

Вам нужно что-то ещё? Вот некоторые другие платформы, стоящие вашего внимания:

1. Diffgram — очень многообещающая платформа, пока находящаяся в бета-версии, оптимизирующая аннотацию изображений обучением RCNN.

2. RectLabel — потрясающий инструмент для ограничивающих прямоугольников и многоугольников на MacOS

3. Prodigy — предлагает бэкенд с собственным хостингом и различными интерфейсами аннотирования, в том числе аннотирование изображений при помощи ограничивающих прямоугольников; цены на продукт начинаются от 390 долларов для личного пользования (пожизненная оплата на каждого пользователя)

4. DataTurks — платформа, имеющая множество возможностей аннотирования; аннотируемые в бесплатной версии данные становятся общедоступными, а корпоративные тарифы начинаются от 300 долларов за месяц для небольших команд

5. ImageTagger — платформа с открытым исходным кодом для совместной разметки изображений

6. Fast Annotation Tool — ещё один инструмент в open source, использующий OpenCV для ограничивающих прямоугольников в формате RotatedRect

7. LabelMe — классика отрасли, инструмент MIT с открытым исходным кодом для аннотирования многоугольниками; однако обладает чрезвычайно низкой точностью

8. PolygonRNN+ — доступен только в виде демо. Многообещающий инструмент, обученный на наборе данных Cityscapes и генерирующий автоматизированную разметку для беспилотных автомобилей с обучением с подкреплением

0
Комментарии
-3 комментариев
Раскрывать всегда