Применение AI для обнаружения болезней и вредителей на растениях
Обнаружение болезней и вредителей является очень важной задачей в области машинного зрения. Это технология, которая использует оборудование машинного зрения для получения изображений и определения наличия болезней и вредителей на собранных изображениях растений. В настоящее время оборудование для обнаружения растительных болезней и вредителей на основе машинного зрения уже начало применяться в сельском хозяйстве и в некоторой степени заменяет традиционное определение визуальным осмотром.
Для традиционных методов обнаружения растительных болезней и вредителей на основе машинного зрения часто используются алгоритмы обработки изображений или ручное создание признаков в сочетании с классификаторами. Этот тип методов обычно использует различные свойства растительных болезней и вредителей для разработки схемы изображения и выбора подходящего источника света и угла съемки, что помогает получить изображения с равномерной освещенностью. Хотя тщательно разработанные схемы изображения могут значительно упростить процесс разработки классических алгоритмов, они также увеличивают стоимость применения. В то же время, в естественной среде часто нереалистично ожидать, что классические алгоритмы будут полностью устранять влияние изменений сцены на результаты распознавания.
В реальной сложной природной среде обнаружение растительных болезней и вредителей сталкивается с множеством проблем, таких как небольшая разница между областью поражения и фоном, низкий контраст, большие изменения в масштабе области поражения и различные типы, а также много шума на изображении поражения. Кроме того, при сборе изображений растительных болезней и вредителей в естественных условиях естественного освещения возникает много помех. В таких случаях традиционные методы обычно бессильны и трудно достичь лучших результатов обнаружения.
В последние годы с успешным применением модели глубокого обучения, представленной сверточной нейронной сетью (CNN), во многих областях компьютерного зрения, например, обнаружение транспорта, распознавание медицинских изображений, распознавание выражений , распознавание лиц и т.д., было разработано несколько методов обнаружения растительных болезней и вредителей на основе глубокого обучения, которые применяются на практике в сельском хозяйстве, и некоторые отечественные и зарубежные компании разработали различные приложения и программное обеспечение для распознавания растительных болезней и вредителей на основе глубокого обучения. Поэтому методы обнаружения растительных болезней и вредителей на основе глубокого обучения имеют не только важное научно-исследовательское значение, но и очень широкие перспективы применения на рынке.
Сравнение традиционных подходов и AI
Чтобы лучше понять различия между методами обнаружения болезней и вредителей растений, основанными на глубоком обучении, и традиционными методами, я провел сравнение по четырем аспектам: поиск признаков, методы, требования и применимые сценарии. Подробные результаты сравнения можно увидеть в таблице 1.
Сверточные нейронные сети (CNN)
Сверточные нейронные сети, сокращенно CNN, имеют сложную структуру сети и могут выполнять операции свертки. Как показано на рис.1 модель сверточной нейронной сети состоит из входного слоя, сверточного слоя, слоя пулинга, полносвязного слоя и выходного слоя. В одной модели сверточный слой и слой пулинга чередуются несколько раз, и когда нейроны сверточного слоя соединяются с нейронами слоя пулинга, полное соединение не требуется. CNN является популярной моделью в области глубокого обучения. Причина заключается в огромной емкости модели и сложной информации, которую обеспечивают основные структурные характеристики CNN, что позволяет CNN использовать преимущество в распознавании изображений. В то же время успехи CNN в задачах компьютерного зрения способствовали растущей популярности глубокого обучения.
Некоторые термины:
CNN — свёрточные нейронные сети. Нейронная сеть, которая содержит хотя бы один свёрточный слой. Типичная СНС содержит и другие слои, такие как слои выборки и полносвязные слои.
Свёртка (Convolution) — процесс применения фильтра («ядра») к изображению. ReLU - не является отдельным компонентом процесса работы, это дополнительный шаг к операции свертки. Цель применения ReLU - увеличить нелинейность наших изображений. Причина, по которой мы хотим это сделать, заключается в том, что изображения по своей природе нелинейны. После ReLU изображения цвета меняются более резко, то есть удается избавиться от линейности.
Фильтр (ядро) — матрица, по размерам меньше, чем входные данные, предназначенная для преобразования входных данных блоками.
Выравнивание — процесс добавления, чаще всего нулевых значений, по краям изображения.
Операция подвыборки (pooling, max-pooling) — процесс уменьшения размера изображения через сэмплирование. Существует несколько типов слоёв подвыборки, например, слой усредненной подвыборки (выборка среднего значения), однако подвыборка по максимальному значению используется чаще всего.
Подвыборка по максимальному значению — процесс подвыборки, в ходе которого множество значений преобразовываются в единое значение — максимальное среди выборки.
Шаг — количество пикселей смещения фильтром (ядром) на изображении.
Методы обнаружения болезней и вредителей на основе глубокого обучения.
Поскольку достигнутая цель полностью соответствует задаче компьютерного зрения, методы обнаружения растительных болезней и вредителей на основе глубокого обучения можно рассматривать как применение соответствующих классических сетей в области сельского хозяйства. Как показано на рис. 2, сеть может быть дополнительно разделена на сеть классификации, сеть обнаружения и сеть сегментации в зависимости от различных структур сети.
В заключение, ручная идентификация болезней и вредителей растений затруднена из-за сложности сбора образцов и ограниченного количества положительных (зараженных) образцов. Существующие методы обнаружения на основе глубокого обучения требуют больших размеченных наборов данных, что требует много времени и труда. Кроме того, модели глубокого обучения не обладают интерпретируемостью и требуют значительных ресурсов памяти и времени для тестирования, что делает их непригодными для использования на мобильных платформах.
Важно исследовать методы несупервизионного обучения и использовать знания о работе мозга и визуальных когнитивных моделей для направления обучения сети. Кроме того, необходимо уменьшить сложность моделей и создать быстро работающие модели без потери точности.
Наконец, выбор подходящих гиперпараметров остается основным препятствием при применении моделей глубокого обучения к новым задачам, таким как скорость обучения, размер фильтра, шаг и количество, эти гиперпараметры сильно зависят друг от друга, и даже небольшие изменения могут сильно повлиять на конечные результаты обучения.