ФОРМИРОВАНИЕ МОДЕЛИ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ НА ОСНОВЕ МЕТОДА «TRANSFER LEARNING»

В последнее время, с быстрым развитием компьютерного зрения, обнаружение объектов (OD) используется во многих отраслях как важная часть компьютерного зрения. На основе обработки изображений OD извлекает функции из изображений, а затем извлекает и анализирует информацию об объекте, такую как категория, местоположение и ориентация. OD широко применяется в реальном времени контекстах, таких как видеонаблюдение, анализ подозрительного поведения и мобильные роботы [1,2,3]. Этот подход позволяет получить очень ценную информацию путем извлечения и анализа характеристик. Однако этот метод сталкивается с проблемами, особенно с точки зрения высоких требований к вычислительным ресурсам и памяти. Традиционные методы машинного обучения извлекают признаки из изображений, а затем передают их в классификатор. Традиционные методы извлечения признаков включают гистограмму ориентированного градиента (HOG), масштабно-инвариантное преобразование признаков (SIFT) и другие. Методы классификации включают метод опорных векторов (SVM) [4,5,6], байесовский метод, деревья

Эти методы опираются в основном на предварительные знания. Они не работают в режиме реального времени, потому что они постоянно эмулируются. Кроме того, эти методы имеют несколько отличительных характеристик, и извлечение крайних признаков иногда неясно. В основе этих методов лежит извлечение признаков, и качество анализа признаков прямо влияет на производительность метода [19,20,21]. Однако в практических приложениях эти методы в основном ориентированы на распознавание конкретных объектов с использованием небольших наборов данных, а способность к обобщению оставляет желать лучшего. Хотя методы машинного обучения постоянно продвигаются, от извлечения признаков в реальном времени до рендеринга изображений, наиболее успешным методом является модель деформируемых разделов (DRM) [16,17,18]. Однако этот метод имеет медленное открытие и зависит от геометрических характеристик образцов. Технология глубокого обучения применялась для распознавания изображений, и в последние годы она достигла больших успехов в распознавании объектов[22].

Трансферное обучение — это метод машинного обучения, при котором модель, обученная одной задаче, переобучается другой связанной задаче. Трансферное обучение имеет дело с такими проблемами, как обучение без опыта и согласованное обучение, и это не просто область применения для глубокого обучения. Трансферное обучение часто используется в глубоком обучении, из-за больших затрат на обучение моделей глубокого обучения или больших и сложных наборов данных, на которых обучаются модели глубокого обучения [7,8,9]. Технология глубокого обучения может обрабатывать и анализировать функции, исследуя и имитируя когнитивные способности человеческого мозга, что имеет значительное влияние на переоценку. В отличие от традиционных методов извлечения признаков, глубокие сверхточные нейронные сети могут достичь высокой точности за счет извлечения признаков с использованием автономных многослойных сверхточных формулировок. Методы глубокого обучения могут адаптировать описание признаков с использованием обучающих данных, они очень гибкие и имеют высокую способность к обобщению [10,11,12]. Методы глубокого обучения включают в себя областную сверхточную нейронную сеть (RCNN), более быструю региональную сверхточную нейронную сеть (Faster RCNN), You Only Look Once (YOLO) и One Shot Multibox Detector (SSD), которые являются наиболее популярными в OD. Однако современные методы OD, основанные на глубоком обучении, все еще сталкиваются с проблемами из-за низкой скорости обнаружения и больших затрат времени [13,14,15].

Составьте набор данных с помощью сбора и аннотирования изображений. Для этого вы можете собрать изображения и пометить их в приложении Roboflow Annotate [15], а затем экспортировать их в формат YOLOv5. Robotflow поддерживает более 30 форматов обнаружения объектов для преобразования потока. Скомпонуйте изображения и пометьте нашу Data set. Экспорт нашего набора данных в YOLOv5. Распознавать объекты в нашем наборе данных Train YOLOv5. Оценить производительность нашей модели YOLOv5. Запустить и протестируем нашу модель, чтобы увидеть результат. Скомпонуйте изображения и пометьте наш Набор данных. Экспортируйте наш Набор данных в YOLOv5. Обучите модель YOLOv5 для распознавания объектов в нашем Наборе данных. Оцените производительность модели YOLOv5. Запустите и протестируйте модель, чтобы получить результат.

0
Комментарии
-3 комментариев
Раскрывать всегда