Цифра

Улыбаемся и машем: плюсы и минусы компьютерного зрения

Человек с нормальным зрением видит и различает окружающую его картинку без особых усилий. Чтобы научить компьютеры «видеть», разработчикам потребовалось приложить немало труда. Умение «смотреть» или компьютерное зрение — это способность машины распознавать изображение, полученное с помощью фото- или видеокамер, и извлекать из него информацию.

Институт статистических исследований и экономики знаний НИУ ВШЭ в прошлом году включил компьютерное зрение в список из 15 наиболее значимых цифровых технологий мировой и российской промышленности (всего институт выбрал 20 так называемых «фронтиров» мировой науки).

И не зря: во-первых, возможности применения компьютерного зрения как в промышленности, так и в быту поистине огромные. А во-вторых, этот сектор развивается невероятно быстро. Аналитический центр TAdviser еще три года назад прогнозировал, что объем российского рынка CV-решений (Computer Vision) к 2023 году вырастет до 38 млрд руб. По отчету Association for Advancing Automation (A3) за первое полугодие 2021 года рынок машинного зрения Северной Америки вырос на 18% до 1,5 млрд долларов по сравнению с аналогичным периодом 2020 года.

Компьютерное зрение в современном понимании возникло вместе с активным развитием технологии нейронных сетей. Однако коммерчески эффективным оно стало, по сути, на рубеже 2015-2016 годов, когда появились новые технологии, аппаратная составляющая, начали активно развиваться графические процессора, которые позволяют на порядок ускорить обработку неструктурированного контента. Процесс стал более управляемым и быстрым, и, как следствие, получил более массовое распространение.

Григорий Винокуров, эксперт ГК «Цифра»

Где пригодится компьютерное зрение

Как показывает опрос, наиболее перспективным для применения компьютерного зрения считается сектор видеонаблюдения и безопасности (выбрали 32% респондентов), производственный сектор (17%), медицина и здравоохранение (14%). За ними идут торговля (10%), оборонный сектор (8%), транспорт и потребрынок (по 5%), сельское хозяйство и логистика (по 3%).

В промышленности компьютерное зрение активно используется уже сейчас. Например, в авиапроме с его помощью считывают маркировку компонентов при сборке на конвейере, добиваются более высокого качества сборки, проверяют, насколько точно выдержаны размеры деталей и расстояния между ними, выравнивают детали при сборке. В пищепроме компьютеры читают этикетки и проверяют, все ли нужное на них указано, а в фармацевтике следят за соблюдением рецептуры при изготовлении лекарств. В горной промышленности компьютерным зрением можно наделить, например, экскаваторы. Zyfra BucketСontrol в реальном времени отслеживает состояние и наличие зубьев ковша и немедленно оповещает диспетчера о превышении допустимого износа или потере зуба.

А можно пойти еще дальше и следить за состоянием не только ковша, но и его содержимого: компьютерное зрение позволяет изучать состав горных пород, анализировать эффективность взрыва породы и в результате повышать производительность работы экскаватора (на 3%). ГК «Цифра», которая разработала эти решения, предлагает и другие варианты использования компьютерного зрения в промышленности. Например, есть возможность следить за состоянием конвейерной ленты на производстве и ее содержимым, или отслеживать все, что попадает при горных работах в кузов самосвала (отслеживать с помощью компьютерного зрения, когда он заполнится и вовремя отсекать негабаритные части горных пород).

Нельзя представить без компьютерного зрения и такие элементы цифровой экономики, как «умный город», автономные автомобили и беспилотные летательные аппараты, аддитивное производство и т. д.

Почему компьютерное зрение — это хорошо

Позволяет снизить затраты и повысить производительность труда

Ручная проверка качества требует больших затрат на оплату труда проверяющих, а системы CV сделают эту работу быстрее и точнее.

Например, использование машинного зрения в сочетании с другими разработками «Газпром нефти» при исследовании горных пород позволит компании сэкономить на лабораторных исследованиях около 85 млн руб. в год, а также в 7 раз ускорить сроки проведения анализа керна (образца горных пород) и, соответственно, быстрее принимать решения при разработке нефтегазовых месторождений.

Сэкономить время, не заниматься рутинной работой и сделать производство более безопасным

Компьютерное зрение при контроле качества или сортировке конвейерных изделий поможет повысить скорость производства и безопасность операторов на вредных производствах, если заменить их на системы компьютерного зрения, а еще с его помощью можно следить за состоянием сотрудников и предотвращать несчастные случаи. Машина потратит на распознавание несколько секунд, в то время как у человека на это могут уйти часы.

Машинное зрение может следить и за безопасностью людей: за тем, носят ли они каски на производстве, маски и перчатки в пандемию (такое решение есть у «Цифры»), контролировать опасную зону или периметр всей охраняемой территории.

Повысить качество

Люди устают и физически не могут отследить все. Компьютеры могут с помощью видеонаблюдения обеспечить выпуск изделий, соответствующих строго заданным параметрам, не допустив каких-либо отклонений, даже незначительных.

Да и в целом компьютерное зрение может решать задачи, которые человеку просто не под силу

Например, никто не сможет с такой скоростью отследить нужного человека по тысячам камер видеонаблюдения, проанализировать огромное количество рентгеновских снимков для постановки диагноза или отследить мелкий брак при производстве.

Автоматизированные системы могут помнить неограниченное количество людей и событий, а время хранения в памяти ограниченно только аппаратным ресурсами. Конечно, человек так не может. Это является основным фактором для систем общественной безопасности. Человек не в состоянии обработать такой объём информации в реальном времени, в отличие от автоматизированных систем. Это основной его плюс.

Григорий Винокуров, эксперт ГК «Цифра»

Позволяет развивать недоступные ранее технологии

Речь о уже ставших приметами нашего времени вещах, как беспилотники, роботы, создание AR и VR-среды, оплата взглядом товара в магазине или снятие денег в банкомате, приложения, позволяющие незрячим людям бегать и даже распознавать эмоции прохожих и сотни других.

А что плохого?

В самой технологии — ничего, вопрос в ее применении.

Не всегда для бизнеса это дешево

Иногда можно найти технологии попроще и подешевле, особенно с учетом дорогой аппаратной составляющей систем в РФ. Например, все еще слишком дорого обойдется использование компьютерного зрения для многих сценариев в ритейле, считает Винокуров.

Потенциал систем компьютерного зрения могут ограничить и сами обучающие их люди

Минус заключается в том, что система очень чувствительна к обучающей составляющей: нейронные сети — это некий аналог человеческого мозга. Обучение сети происходит на ограниченном человеком объеме данных, который человек физически может проверить. Если упростить, сеть, которую обучали распознавать лица европейцев, будет плохо работать с азиатами, которые не входили в обучающий data set.

Григорий Винокуров, эксперт ГК «Цифра»

Моральный аспект

Действительно, компьютерное зрение дает огромные возможности для развития бизнеса и промышленности, но и несет большие риски. Да, системы видеонаблюдения могут помочь выявить преступников. Но не стоит и забывать, что полученной с камер информацией зачастую может завладеть злоумышленник. Системы распознавания лиц выявляют людей, похожих на заданный ей список. При этом нет полной гарантии защиты такого списка и данных людей от взлома.

Проблема конфиденциальности и вторжение в частную жизнь

Не все готовы жить в постоянном окружении видеонаблюдения. По некоторым оценкам, в России сейчас больше 10 млн камер. Много это или мало? Эксперты говорят, что это меньше, чем в Китае, США или Германии по количеству на сто человек. Может и меньше, но вот преступность в Москве в первом полугодии 2020 года снизилась на 40% благодаря системе видеонаблюдения, парируют защитники.

Конечно, у систем компьютерного зрения есть как преимущества, так и недостатки. Нельзя говорить, что машины на 100 процентов эффективнее человека: да, искусственный интеллект может быть точнее, но он все еще не обладает возможностью человека к абстрагированию и восприятию информации в контексте чего-либо. Соответственно, при решении о применении компьютерного зрения стоит рассматривать каждую ситуацию индивидуально. Но также бесспорно и то, что за этими технологиями будущее. И во многих случаях замена человеческого зрения на машинное - выгодное вложение.

0
1 комментарий
Вадим Вахрамов

В инспекционных системах это всё же pattern matching (то есть распознать не приблизительно (по количеству фич) то, что надо, а в точности сравнить с шаблоном, с определённого угла, с определённым освещением). И конечно человек каждую точечку не разглядит, каждый узел оптического отклонения не проинспектирует в разумное время.
Про начало появления систем - с начала 2000 годов pattern matching точно был распространён, системы были сложными, несколько машин с фреймграбберами с линейных камер (каждая камера за свой участок предмета отвечает). Одну из таких систем я описал (как модернизировал) на своём сайте, но он ещё не доделан)))(вебчик - не совсем моё)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Читать все 1 комментарий
null