{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Категории индивидуальности. Как системы распознавания работают в мире, где нет «стандартных» людей

Технологии распознавания лиц сегодня могут конкурировать с человеческим зрением в точности и объективности. В условиях сложного и разнообразного современного мира нам, людям, не всегда просто понять, мужчина перед нами или женщина, узнать человека после ряда пластик и определить этническую принадлежность. Тщательно обученные нейросети могут дать нам фору в этом вопросе. Мы в facemetric решаем разные задачи по распознаванию и идентификации, поэтому в статье решили рассказать, как работает эта технология, от чего зависит ее точность, а также о том, можно ли обмануть систему с помощью увеличения губ или коррекции носа, и как технология изменится в будущем.

От чего зависит точность распознавания

Процесс распознавания лица можно разделить на два этапа. Сначала система ищет в кадре само лицо. Когда детектирование прошло успешно, в дело вступают обученные заранее нейросети. Они определяют уникальные параметры и признаки лица, переводят их в цифровой код. Дальнейшая работа алгоритмов ведется с этим кодом.

Успех распознавания и точность анализа зависят от количества и разнообразия данных, которыми снабдили систему в процессе обучения. Каталоги таких данных называют датасетами. Чем шире датасет, чем больше он соответствует аудитории, которую надо будет анализировать — тем выше точность. Например, чтобы нейросеть отлично распознавала лица определенной этнической группы, ей нужно “скормить” большое количество изображений людей этой группы — под разными углами, при разном освещении, в разных ракурсах.

Именно поэтому компаниям, выходящим в новые регионы, нужно приложить много усилий на подготовку датасетов и дообучение своих нейросетей, чтобы обеспечить высокую точность распознавания нового для них типа лица. Интересно, что когда китайские компании несколько лет назад выходили на российский рынок, у них не хватило точности распознавания европейских лиц, тогда как у себя на родине их алгоритмы показывали блестящие результаты.

В процессе подготовки датасета создается большой каталог из фотографий разных лиц на разном фоне. Обычно системы распознавания обучаются на взрослых, потому что большинство сценариев для этой технологии распространяются именно на них – СКУД (система контроля и управления доступом) на предприятиях, аналитика потока посетителей, оперативно-розыскная деятельность и т.д. Если нам интересно посчитать количество детей, обеспечить их безопасность или проанализировать предпочтения, нейросеть необходимо обучать специально для этой задачи.

Идентификация пола. Как быть с андрогинностью?

Отдельного обучения нейросети требует и решение задачи по распознаванию пола. Как мы помним, для системы распознавания человеческое лицо — набор параметров и особенностей. Для правильного определения пола система должна сфокусироваться на решении именно этой задачи и ей нужно предоставить достаточно материала для анализа, чтобы алгоритм выявил существенные признаки и различия полов.

Отличный иллюстратор работы такого алгоритма — фильтр популярного приложения FaceApp, который делает из мужчин женщин и наоборот. Это тоже нейросеть, которая вытягивает из изображения ключевые признаки и меняет их под нужный пол. Например, если надо сделать из женщины мужчину, программа меняет форму глаз и бровей, делает крупнее челюсти и скулы. Таким образом, новосозданный мужчина все еще похож на оригинальную женщину, но мы легко считываем измененный пол. Чтобы помочь нам с этим, программа добавляет мужскую прическу и растительность на лице, но для самого алгоритма эти признаки вторичны.

Нейросеть, обученная различать мужские и женские черты лица, способна справляться с распознаванием пола даже в условиях современной моды на андрогинность. На наше восприятие в определении пола влияют растительность на лице, рост, грудь, ширина бедер и плечей,одежда, прическа, макияж и аксессуары. Сейчас же одежда все чаще унисекс, многие женщины не носят макияж и украшения, коротко стригутся. Не привыкший к этой моде человек может иногда спутать короткостриженную девушку в свободной одежде с молодым парнем. Система распознавания, в свою очередь, анализирует только лицо и не дает себя сбить другими факторами.

Бывают ситуации, где эти признаки наоборот помогают системе. Когда нам надо определить пол ребенка или пожилого человека, именно внешняя атрибутика помогает не ошибиться. У детей половые признаки еще выражены недостаточно ярко, а у пожилых людей гормональный фон меняется и происходит некоторое усреднение. В некоторых ситуациях, если перед вами ребенок или пожилой человек, вы не всегда определите, какого он пола без каких-либо косвенных признаков. В таких случаях для принятия решения систему учат анализировать вторичные факторы — одежду, макияж, аксессуары, растительность на лице.

Эксперименты с внешностью. Возможен ли обман?

Любые манипуляции с внешностью для видеоаналитики в большинстве случаев почти незаметны. Технология распознавания лиц здесь похожа на анекдотичного мужа, который не заметил, что у жены новая прическа и форма бровей. Чтобы сбить с толку камеру, надо переделать лицо до неузнаваемости. Если вы накачаете губы или сделаете ринопластику, но при этом не измените скулы и форму глаз, то для системы останетесь прежним. Татуировки на лице, смена цвета глаз или даже цвета кожи для компьютера тоже останутся незамеченными. Значение в идентификации имеет только геометрия лица.

Возьмем, к примеру, Майкла Джексона. Глядя на его фотографии до преображения и после, сложно сказать, что это один и тот же человек. Майкл поменял цвет кожи, форму носа, афро превратилось в прямые черные волосы, макияж визуально изменил форму бровей и губ. Нам может показаться, что он стал совсем другим человеком, но система распознавания все равно может узнать его по форме головы, подбородку, надбровным дугам, лбу, глазам и другим признакам. И несмотря на светлый цвет кожи, классификатор этнической принадлежности тоже с большей вероятностью причислил бы его к негроидной расе — по ряду других характерных для этой расы черт.

Разработчики систем видеоаналитики научились работать со всем многообразием современного мира и продолжают совершенствовать технологию. Нейросети могут лучше, чем человеческий глаз, выявить характерные черты лица и определить по ним пол, возраст, этническую принадлежность. Анализ визуальной информации о человеке ускоряет и упрощает многие задачи. Например, с его помощью уже сегодня можно совершать оплату покупок по лицу. Темпы развития технологии распознавания позволяют предположить, что уже скоро не нужно будет проходить генетические тесты, чтобы узнать свои корни или определить риски некоторых генетических заболеваний, достаточно будет просто показать себя умной камере.

0
13 комментариев
Написать комментарий...
Елизавета Тихер

Уже жду, когда видеоаналитика будет таргетировать рекламу :)

Ответить
Развернуть ветку
Yury Godyna

Такие кейсы уже есть. В масс-маркете таргетирование идет по полу/возрасту/эмоциональному состоянию в инфокиосках и на панелях.
В закрытых зонах (конференции, выставки) можно более узко и точно выдавать

Ответить
Развернуть ветку
Елизавета Тихер

В масс-маркете не встречала пока вообще.. А где, например? Если о Мск говорить.

Ответить
Развернуть ветку
Yury Godyna

У нас пока кейсов в масс-маркете не было. Мы больше работаем с организаторами мероприятий (конференции, выставки и т.п.)
Про коллег-конкурентов могу сказать, что такие решения применяются, в частности на АЗС. Если видите на кассе экран с рекламой - он работает с таргетингом по полу/возрасту.
Также подобную систему делали ребята в лаборатории Х5 Retail Group - в частности в их демо-магазине на Нижегородской работал такой экран на входе в магазин.

Основная проблема решений на масс-маркете - подбор и управление контентом. Здесь нужно партнерство с рекламным агрегатором.
Например, X5 работали с площадкой Яндекса. Но выделить контент, связанный только с ассортиментом магазина весьма проблематично - алгоритмы Яндекса не позволяют.

Ответить
Развернуть ветку
Maria Lyshnova

Тренды 2020 -маски. Как сейчас в них идёт распознавание?

Ответить
Развернуть ветку
Yury Godyna

Маски - это настоящий вызов для систем распознавания. При чем они доставляют хлопот на всех этапах - и при детекции, и при распознавании, и при классификации по полу/возрасту/эмоциональному состоянию и т.п.
Поэтому приходится перестраивать и переобучать алгоритмы под новые условия. А также выбирать другие камеры и способы их установки.
На данный момент проблемы детекции практически решены, распознавание также подтягивается по качеству (хотя до безмасочных показателей еще далеко). Классификация по полу/возрасту - самая большая проблема, поэтому и приходится обращаться к вторичным признакам - прическа, одежда, аксессуары

Ответить
Развернуть ветку
Valeria Kuznetsova

Надеюсь, что мир станет безопаснее и украсть сумку в кафе будет невозможно.

Ответить
Развернуть ветку
Yury Godyna

Уже были случаи в нашей практике, когда наша система позволяла оперативно разбирать такие инциденты на фуд-кортах и находить воришек.
Тем не менее, рекомендуем все же следить за своими вещами :)

Ответить
Развернуть ветку
Даниил Пленин

А как вы близнецов будете распознавать? А что с витилиго?

Ответить
Развернуть ветку
Yury Godyna

Это, на самом деле, серьезная проблема. Для однояйцевых близнецов почти нерешаемая, если они визуально неразличимы. Пока это самый верный способ обмануть систему. Поэтому в особо критичных для фрода системах добавляются дополнительные факторы, например, распознавание по голосу или поведенческий анализ.
Просто по лицу даже iPhone не различает, хотя там практически идеальные условия и используется верификация вместо идентификации.

Ответить
Развернуть ветку
Yury Godyna

Что касается витилиго, то это может стать проблемой, как например, является общей проблемой распознавание сенегальцев из-за их особого баклажанов цвета кожи. Но мы пока с такой проблемой не сталкивались.
Обычно такие проблемы решаются или минимизируются уходом в ИК-диапазон

Ответить
Развернуть ветку
Илья

Если в правду среди нас находятся инопланетяне этот аппарат с лёгкостью определит.😊

Ответить
Развернуть ветку
Илья

Хочу отметить, что создатели этой камеры по моему мнению,  N 1  гениоси  для всего мира.👍

Ответить
Развернуть ветку
10 комментариев
Раскрывать всегда