Эксперт нашёл в облаке Alibaba открытую базу с личными данными жителей Пекина — за ними следили системы «умного» города Статьи редакции
В базе хранились сканы из системы распознавания лиц, примерный возраст и национальность жителей, а также другие данные.
Эксперт в сфере безопасности Джон Ветингтон обнаружил базу данных в Alibaba Cloud без пароля. В ней хранились данные о части жителей Пекина, собранных системой слежения, пишет Techcrunch.
Кому принадлежит база данных, неизвестно. После того, как журналисты Techcrunch рассказали о ней Alibaba, компания сообщила клиенту о проблеме, а доступ к базе был закрыт.
Информация хранилась в базе данных Elasticsearch, в ней содержались гигабайты сканов из системы распознавания лиц. Эта система следила за жителями как минимум двух районов Пекина. Отрытые данные содержали достаточно информации, чтобы точно определить, куда и когда ходили люди.
Кроме того, в ней были характеристики для некоторых людей: их примерный возраст, принадлежность к этнической группе, идентификационные номера (ID), а также пометки о совпадении распознанного лица с данными из базы полицейских (например, «наркозависимый» или «освобождённый из тюрьмы»).
Система также может отслеживать устройства с поддержкой Wi-Fi, а поля в таблице говорят о том, что она способна собирать IMEI и IMSI для идентификации, пишет Techcrunch.
Система распознавания лиц в Китае действует с 2015 года, напоминает TJ. В 2018 году полицейские города Чжэнчжоу начали тестировать солнцезащитные очки с функцией распознавания лиц, которые должны помочь ловить преступников.
Хреново быть пекинцем
В Мск с апреля 2019 на Октябрьском Поле в метро поставили системы видеонаблюдения с рапознаванием лиц. Фирма VisionLabs этим занимается. Если этот пилотный заход будет иметь успех, поставят по всей Москве. Дальше в города и регионы пойдёт.
Распознавание лиц давно работает как эксперимент, камеры в потолке на части станций в метро, якобы задержали ещё в 2018 - 50 человек кто был в розыске.
Месяц назад был на ВДНХ в павильоне умный город (рядом с макетом москвы) там можно посмотреть со всех 170 000 камер в мск, думаю в этом или следующем году все камеры в Москве станут подключены к серверам по распознаванию лиц.
Найти бы ещё такой ЦОД. Распознавание и сверка с базой в 100 тысяч человек - нетривиальная задача.
Задача линейно масштабируется количеством серверов! Не переживайте - все курят за наши деньги, сколько надо - столько и купят! Еще и откат получат с закупки
Да бросьте, findface находил людей за секунду по всей базе вк, в котором уже 75 миллионов человек, и умножьте это на 10 минимум для количества фото, которые анализируют.
И это еще в то время, когда они не были на гособеспечении, и сами сервера арендовали.
Там же поиск идет не по фото, а по некоторому хэшу.
Первоначально - по фото, а дальше - да, есть идентификатор. Разница findface не поток лиц каждые 0,3 секунды с 1000 камер, а хаотичные запросы.
Мы не знаем сколько людей им пользовалось одновременно, явно не мало. И они справлялись будучи стартапом, а сейчас они на гособеспечении, сейчас проблемы с железом вообще нету.
Кстати сейчас findclone сделали, говорят всего один человек запустил. Что тоже показывает что ЦОДы там и близко не требуются.
ЦОД который хранит данные всех 170 000 камер в течении 1 недели уже есть. В розыске в РФ где-то 30-100K человек это не так много как говорит vision labs, думал расходы на увеличение цод на постоянное распознавание ещё плюс 10-20% в год не более.
Хранение - это малая толика. Обработать же - это не так просто 24 камеры убирают один средний ксеон по обработке CV. 170 000 / 24 = 7100 процессоров.
Да не надо все обрабатывать, достаточно сверять полученные слепки содержащие в том числе и данные фото. Сверить 1 слепок с другим ну...как вам сказать, не процессоры нужны, а мозги.
Первоначальная обработка кадра всё-таки потребуется. Как минимум, нужно выделить лицо.
Типовая нейросеть. Если потребуется - можно специализированный сопроцессор с такой сеткой воткнуть.
Уже давно это на гпу считают, какой ксеон. Они раз в 100-1000 мощнее, так что нормально.
Вижн? На цпу
Это херня, а не задача. Студент может сделать.