«Мне нужна твоя одежда!» Мифы и реальность видеоаналитики

При слове видеоаналитика у простого обывателя сразу возникают ассоциации с фантастическими произведениями. Рисуется картинка из фильма про робота-терминатора, который сканирует контуры человека, сопоставляет с размером своего тела и мгновенно определяет, подходит ему чужая одежда или нет. Чтобы не ошибиться в возможностях технологии, отделить вымысел от реальности, нужно разобраться в нюансах и проанализировать неудавшиеся проекты.

Мне нужна твоя одежда, ботинки и мотоцикл!
Мне нужна твоя одежда, ботинки и мотоцикл!

В TG пишу про свой взгляд собственника двух компаний на бизнес, людей и жизнь. Всегда честно, периодически резко, иногда с матом. https://t.me/vroderabotaetno

Неоправданные ожидания

Заблуждения насчет возможностей видеоаналитики возникают как по причине завышенных ожиданий со стороны клиента, так и из-за некорректного поведения некоторых представителей организаций-продавцов данной технологии.

Поставщики, рекламируя технологию, пытаются удивить клиента некой экзотикой, представляя, что анализ видеокартинки на основе искусственного интеллекта это нечто такое, чего не может человек. Это не так, видеокамера не видит больше, чем обыкновенный глаз. Более того, Homo sapiens, обладая врожденной интуицией, разберется во многих ситуациях качественней и быстрей, чем нейросеть, соединенная с камерой.

В результате многие, на первый взгляд выполнимые проекты не доходят до реализации. Причины, по которым ожидания не срастаются с действительностью можно условно разделить на три группы: нереальные проекты, экономическая необоснованность и организационные проблемы.

Мифические проекты

Возникают как правило из-за неподготовленности клиента, его неадекватного восприятия реализованных кейсов и недостаточного понимания технологии. Несколько примеров нереализованных по этой причине проектов от одного из ведущих российских поставщиков систем видеоаналитики для промышленного применения:

  • Запрос крупного предприятия на выявление несунов на проходной. Заказчик посчитал что видеоаналитика – это нечто вроде рентгена и зафиксирует ворованную вещь, спрятанную под одеждой. По той же причиненевозможно автоматически вычислить психопата-стрелка, пришедшего в школу с оружием. Если профессиональный охранник, обладая опытом и интуицией сразу определит злодея по безумным глазам и длинному плащу с оттопыренной полой, то система видеоаналитики в этом случае предотвратить трагедию не сможет.
  • Распознавание конфликтных ситуаций. Система не отличит объятия друзей при встрече от драки двух хулиганов. Искусственный мозг не обладает интуицией и не в способен фиксировать эмоциональное состояние субъекта.
  • Сортировка металлолома или мусора. Для идентификации нужно описание каждого типа предмета или его упаковки, а их сотни тысяч. Задача на сегодняшний день из разряда невыполнимых.

Чтобы у заказчика не возникало ложных ожиданий, эксперты в области видеоаналитики предлагают следующий тест для понимания реалистичности задумки. Нужно представить просмотр ролика длинною не более 3 секунд без понимания контекста темы видеоматериала. Все что может увидеть человек не включая интуицию, сможет определить и система видеоанализа. На большее она не способна.

Дополнительный факт, видеоаналитика никогда не дает 100% результата, максимум 98%, в контрактных обязательствах обычно предусматривается 95%. В проектах, требующих фиксации точного количества распознаваемых объектов, применять эту технологию нецелесообразно.

Дорогая реализация

Эта группа вполне реальных моделей применения видеоаналитики, но несостоявшихся по причине высоких затрат на реализацию. Неподъемные расходы могут быть как на оборудование, так и на проработку большого количества сценариев. Нередки ситуации, когда в целом бюджет проекта системы видеоаналитики вполне подъемный, но все равно дороже, чем поручить наблюдение и выполнение соответствующих действий обычному сотруднику.

Примеры кейсов этой группы несостоявшихся проектов:

  • Дефектоскопия лопастей вертолета, при этом они должны крутиться. Посчитали сколько должно быть камер под разными ракурсами. Оценили количество вариантов повреждений: сколы, царапины, трещины разных размеров и конфигураций. Пришли к выводу, что работа трех инженеров по качеству существенно дешевле.
  • Заказ крупного агрохолдинга на подсчет животных в загоне и количества забитых туш. Загон длинный и двух имеемых камер в начале и конце недостаточно. Для получения приемлемого результата необходимо либо устанавливать несколько десятков камер, либо делать передвижную по рельсе под крышей.

В случае с забоем другая ситуация: с камерами порядок, подсчет происходит на компактной площадке, но туши перекрывают друг друга. Необходима реализация сложного алгоритма идентификации по небольшим фрагментам. В обоих примерах оказалось проще посчитать вручную.

  • Фиксация оставленного предмета. Очень актуальная тема в плане безопасности и противодействия терроризму. Недобросовестные поставщики из разряда инфоцыган, пользуясь актуальностью проблемы, демонстрируют анализ и фиксацию появления неопознанного объекта в пустой комнате. Так в жизни не бывает, например, проход человека перед камерой, означает для системы видеоаналитики появление совершенно другого предмета. Чтобы понять, что это тот же самый объект, нужно разработать сложный алгоритм сопоставления и идентификации и обучить этому нейросеть.

Важный момент, проекты видеоаналитики характеризуются непредсказуемостью бюджета на старте. Подобные решения по своей природе не могут быть коробочными. Это как ателье по индпошиву, выкройки и лекала изготавливаются по конкретной фигуре. Каждый проект выполняется по законам научно-исследовательской работы, то есть по окончании мероприятий по моделированию, стоимость может сильно отличаться от планируемой и даже не исключен вывод о невозможности реализации задумки по сформулированным требованиям. Не каждый заказчикзаранее согласится с таким развитием событий.

Организационные проблемы

Тоже категория теоретически реализуемых проектов, но не завершившихся из-за организационных нестыковок. Характерный пример – желание компании по пошиву спецодежды снизить издержки продаж, возникающих в результате несоответствия размеров при заказе крупных партий. Возникла идея перед поставкой массово прогонять рабочих заказчика через систему видеоанализа для определения необходимого количества одежды каждого размера. После проведенных исследований выяснилось, что помимо сложной конфигурации камер, для точного считывания необходимо, чтобы каждый сотрудник без верхней одежды несколько раз крутанулся в рамке. Обеспечить подобное дефиле шахтеров и металлургов заказчик не смог.

Второй случай – контроль трудовой дисциплины. Руководство компании захотело знать, как часто и по какому маршруту сотрудники передвигаются по офису. Идентификация по лицам не сложная для видеоаналитики задача. Однако, существующая система видеонаблюдения не обеспечивала нужный ракурс. Перевесить камеры руководство и представители службы безопасности компании-заказчика категорически отказались.

Трудности организации несколько иного характера возникли при реализации системы контроля вывоза твердых бытовых отходов (ТБО). Были проработаны системы наблюдения за несанкционированными свалками и анализа блокировки припаркованными машинами контейнеров ТБО. Какие-то бюрократические проволочки вылились в нежелание заказчика внедрить подготовленные наработки.

Кроме анализа проектов, для успешного их завершения, необходимо понимать внутреннюю кухню видеоаналитики. Отличать ее от простого видеонаблюдения и других технологий, где присутствует съемка фото или видеокамерой.

Основы технологии

Технология видеоаналитики достаточно простая – это не искусственный супермозг, это внятный алгоритм, который говорит нейростети, что нужно делать. Другими словами, это извлечение из видепотока необходимой информации, понятных метрик, на основе которых формируются сценарии вероятных успешных действий в той или иной сфере. Сложности возникают, когда действия не простые и вариаций много.

Методов видеоаналитики несколько. Самый простой – сравнение с эталоном. Например, распознавание лиц. На фото наносится более сотни точек, полученная модель сравнивается с вариантами в базе данных. С высокой долей вероятности подбирается аналог.

Сложнее метод поиска аномалий. Показательна в этом плане работа по выявлению наличия или отсутствия средств индивидуальной защиты (СИЗ). Система достаточно быстро понимает, что если у человека вместо верхней части головы полукруглый предмет определенного цвета, то это каска, т.е. сотрудник защищен. Проблемы возникают, когда субъект нагнулся или лежит, нестандартным положениям искусственный интеллект приходится дополнительно обучать. Это кропотливая работа по ручной отрисовке нескольких сотен тысяч кадров и скармливанию их нейросети. Следующий этап – выявление ложных распознаний и дообучение системы не реагировать на них.

Искусственный интеллект нужно долго и муторно обучать, чтобы потом он мгновенно реагировал на заданнуюситуацию. Известен случай, когда во время пандемии нейросеть обучали реагировать на отсутствие масок, перчаток, специальных костюмов по популярному сериалу «Интерны». Порядка 300 серий, более 5 млд. кадров – идеальныйвидеоматериал для наработки всех возможных вариантов.

Собственно, в системе не более 10% непосредственно видеоаналитики, остальное – машинное обучение. Объем предварительной работы с нейросетью в основном и определяет трудозатраты и конечную стоимость решения в целом.

Сферы успешного применения

Одно из первых результативных применений технологии – распознавание текста. Это не новая технология, работает давно, можно сказать прошлый век, тем не менее это классическая видеоаналитики. Надежность распознавания в этой области обусловлена малым количеством вариаций. 10 цифр и 33 буквы, под каким ракурсом ни ставь камеру, идентификация однозначна.

Следующий этап – биометрия. Распознавание лиц, отпечатков пальцев, радужной оболочки глаза и т.д. В этой области алгоритмы сложнее, но логика действий понятна, предсказуема и не вызывает сложностей при реализации. Работает надежно и применяется во многих направлениях: системы контроля доступа, домофоны, идентификация на границе и др.

Распознание стационарных объектов. Применяется там, где нет динамики и предметы сложно двояко интерпретировать. Например, те же СИЗы, бревна или трубы в прицепе тягача, самосвалы в карьере и пр.

Последние успешные проекты наблюдаются в процессах, где присутствует четкая последовательность действий(action recognition). Например, упаковка тортов: появляется торт, устанавливается на основание упаковки, накрывается крышкой и завязывается – все, других вариантов нет. Подобные сценарии легко отслеживаются системой видеоаналитики и обрабатываются при наличии необходимого количества вычислительных мощностей.

Более сложное развитие action recognition получило в спорте, когда анализируется набор нескольких последовательныхдействий спортсменов. Выявляются те комбинации, примененные против соперника, которые наиболее часто приводят к успеху.

Перспективы

Если провести несложный анализ несостоявшихся проектов, представленных в первом разделе статьи, то можно понять, что большинство из них реальны, но не реализуются сегодня из-за дороговизны техники или ресурсов. Опираясь на закон Мура о регулярном увеличении производительности вычислительных средств, можно сделать вывод, что дорогостоящие технологии станут со временем более доступны.

Яркий пример – процессы action recognition, которые совсем недавно реализовывались плохо, а сегодня такие сценарии вполне реалистичны. В этом плане стоит обратить внимание на технологию re identification по отслеживанию трека объекта при переходе из одной камеры в другую. Необходимо непрерывное сопоставление картинки с каждой видеокамеры с многомиллионной базой данных объектов. Сейчас по затратам это под силу только государственным структурам и крупным корпорациям. Пройдет немного времени и такой метод отслеживания станет ординарным.

Другое направление – подгонка процесса под систему. Что имеется ввиду? Чтобы однозначно определить, какойпокупатель взял товар, нужно обложить каждый товар, например, пакет молока десятком камер. Этого никогда никто делать на будет и Мур тут не поможет. А вот доработать стеллаж так, чтобы пакет можно было взять только одним способом, по аналогии с вендинговыми аппаратами, вполне реализуемая процедура.

Или сортировка мусора. Сейчас камень преткновения в отсутствии тотальной базы данных утилизируемой тары и дороговизны ее создания. Один и путей формирования подобного хранилища – при производстве каждого типа товара сканировать параметры упаковки и передавать в единую систему. Звучит футуристически, но, когда производители и общество осознают, что отсутствие переработки приносит ощутимые убытки или ставит под угрозу существование человечества, такой сценарий несомненно воплотится в жизнь.

В любом случае системы видеоаналитики будут совершенствоваться и самый фантастический проект со временем станет реальным. Большинство путей развития понятны и предсказуемы уже сегодня. Главное не бояться новых исследований, изысканий, проверки гипотез даже с перспективой получения отрицательного результата.

Обсудить внедрение видеоаналитики на вашем предприятии можно здесь.

11
Начать дискуссию