Эксперт нашёл в облаке Alibaba открытую базу с личными данными жителей Пекина — за ними следили системы «умного» города Статьи редакции

В базе хранились сканы из системы распознавания лиц, примерный возраст и национальность жителей, а также другие данные.

Эксперт в сфере безопасности Джон Ветингтон обнаружил базу данных в Alibaba Cloud без пароля. В ней хранились данные о части жителей Пекина, собранных системой слежения, пишет Techcrunch.

Скриншот части базы данных Techcrunch

Кому принадлежит база данных, неизвестно. После того, как журналисты Techcrunch рассказали о ней Alibaba, компания сообщила клиенту о проблеме, а доступ к базе был закрыт.

Информация хранилась в базе данных Elasticsearch, в ней содержались гигабайты сканов из системы распознавания лиц. Эта система следила за жителями как минимум двух районов Пекина. Отрытые данные содержали достаточно информации, чтобы точно определить, куда и когда ходили люди.

Кроме того, в ней были характеристики для некоторых людей: их примерный возраст, принадлежность к этнической группе, идентификационные номера (ID), а также пометки о совпадении распознанного лица с данными из базы полицейских (например, «наркозависимый» или «освобождённый из тюрьмы»).

Система также может отслеживать устройства с поддержкой Wi-Fi, а поля в таблице говорят о том, что она способна собирать IMEI и IMSI для идентификации, пишет Techcrunch.

Система распознавания лиц в Китае действует с 2015 года, напоминает TJ. В 2018 году полицейские города Чжэнчжоу начали тестировать солнцезащитные очки с функцией распознавания лиц, которые должны помочь ловить преступников.

0
146 комментариев
Написать комментарий...
Рустам Фатов

Умный город следит за тобой!

Ответить
Развернуть ветку
Michael Smith

Я уже ношу и вам советую.

Ответить
Развернуть ветку
Pavel Ivanov

Вы не могли бы объяснить, какие именно проблемы решаете, избегая распознавания лица? Без подвоха вопрос :-) Интересна модель мышления. "Моё лицо могут распознать..." - а дальше? Что самое страшное произойти может?

Ответить
Развернуть ветку
Michael Smith

Это не на уровне проблемы, есть такая вещь как гражданская позиция и ненасильственное сопротивление.
Если бы мне на работе приходилось бы записывать в журнал время, когда я хожу в туалет, я бы тоже протестовал.
Вы спросите, а что тут такого? Ну сходил в туалет и записал, скрывать же нечего.
Это сложно объяснить, если для вас это норма, что вам нужен какой-то супервайзер, кто будет контролировать вашу жизнь, куда вы ходите, с кем, как часто.

Это даже не касаясь возможных злоупотреблений такой информацией, которые неизбежно будут.

Ответить
Развернуть ветку
Denis Kiselev

Маска не сильно спасает. Будут распознавать глаза и фигуру в целом. Ещё и в сочетании с радиомаячком у вас в кармане - смартфоном.

Ответить
Развернуть ветку
Michael Smith

Смартфоны дают привязку только к базовой станции, триангуляцию пока не используют. Распознать фигуру и глаза это пока не по силам.

Ответить
Развернуть ветку
Denis Kiselev

Сам по себе радиомодуль смартфона в твоём кармане показывает твоё местоположение с точностью 50-150м. Сотовые операторы собирают эти данные, государство вполне может их получить. Как раз триангуляцию и используют - для отслеживания местоположения абонента. Посмотрите хотя бы описание сервиса mpoisk.ru.

Насчёт «смартфоны не используют». Для определения абонента по сотовым вышкам не обязательно вообще задействовать смартфон. Любой сотовый радиомодуль можно определить - и простой кнопочный телефон, и модем. Во вторых, к слову - сами смартфоны используют разные методы определения местоположения - почитайте про aGps. Но это не к теме обсуждения.

Насчёт «распознать фигуру и глаза пока не в состоянии». Вопрос дискуссионный - например, Face ID возможно обучить такому фокусу. Совмещение нескольких признаков - наличие вашего телефона в том районе, наличие профиля вашей фигуры в бд распознавания - все это увеличивает точность распознавания.

Ответить
Развернуть ветку
Michael Smith

Не используют триангуляцию, я знаю как одного человека искали по его мобильнику, но в соседнем районе, потому что БС там стояла, а не в его районе.

mpoisk.ru
200-400 метров в центре города, от 1 км на окраинах и за пределами города.

Это как раз и есть определение по базовым станциям а не триангуляцией

Ответить
Развернуть ветку
Denis Kiselev

Скажите - а «определение по базовой станции» и «триангуляция» - чем в вашем представлении отличается то?

Ответить
Развернуть ветку
Michael Smith

Я имел в виду что местоположение вычисляется по району обслуживания одной БС, к которой идет подключение, без триангуляции по нескольким БС.
Точность "от 1 км на окраинах города" однозначно говорит, что триангуляция не делается, "от 1 км" – это просто район обслуживания у БС.

Да, и вы выше писали про исторические данные, по ним нельзя посчитать триангуляцию ретроспективно. Чтобы провести триангуляцию, нужен софт который в реальном времени будет считать задержки от разных БС (причем от неактивных БС, к которым абонент не подключен), чего разумеется не делается для всех миллионов абонентов.

Ответить
Развернуть ветку
Denis Kiselev

Конечно, нет. Местоположение абонента всегда вычисляешься по данным от нескольких базовых станций. Просто плотность базовых станций на окраине города ниже - и там точность снижается.

Насчёт «посчитать ретроспективно». Базовые станции ведут лог радиомодулей в пределах их зоны действия. Этот лог можно сохранять очень легко - он мало места занимает! И ведётся он в режиме реального времени. Получив данные от сети базовых станций у вас будет трек любого радиомодуля. МТС, например, монетизирует эту штуку через mpoisk. Уверен - для органов эти логи доступны и хранятся долго. Насчёт триангуляции - как раз пеленг радиомодуля при известном местоположении локаторов - классическая задача радиопеленгации.

Ответить
Развернуть ветку
Michael Smith
Просто плотность базовых станций на окраине города ниже - и там точность снижается.

Вы ерунду пишите, "от 1км", это как раз плотность БС на окраинах города. Просто посмотрев координаты текущей БС можно получить точность от "1 километра".
А триангуляция, если бы использовалась, дает точность десятки метров.

Этот лог можно сохранять очень легко - он мало места занимает!

Перечитайте что я выше писал, надо считать задержки запрос-ответ в микросекундах, а не просто лог подключений.
Чтобы подсчитать эти задержки неактивные БС должны специально опрашивать аппарат, чего они не делают, это делается только специальным софтом, и для определенных номеров. За всеми так следить нереально, это многократно повысит нагрузку на БС.

Ответить
Развернуть ветку
Denis Kiselev

На окраине города базовые станции могут быть разнесены на километры. Поэтому подключение может происходить только к одной станции - до других радиомодуль просто не добивает. Но в целом - никто никогда не считает положение только по одной вышке - когда это возможно.

Насчёт микросекунд. Вы с gps путаете. В случае с сотовой связью достаточно 2-3 базовых станций для приемлемой точности в 50-150м и сохранить уровень сигнала. Эта информация вполне доступна без повышенной нагрузки на базовые станции - потому как является сутью сотовой сети с плавным переключением вышек.

Ответить
Развернуть ветку
Michael Smith
Насчёт микросекунд. Вы с gps путаете

Ничего не путаю, уровень сигнала сильно скачет от застройки, по нему расстояние до БС не вычислить.
Вот здесь показано что на уровне сигнала триангуляцию сделать не получится, только по временным задержкам http://www.layakk.com/docs/Taddong_BruCon2013.pdf

Ответить
Развернуть ветку
Denis Kiselev

Вы дали ссылку на статью, где описывается решение задачи - как найти телефон не имея доступа к сотовой сети.

Мы же обсуждаем ровно противоположную ситуацию.

Ответить
Развернуть ветку
Michael Smith

Вы всю статью прочитайте, а не только начало.
Там делаются фейковые БС. Все что там описано для фейковых БС относится и к БС оператора.

Можно по комнате пройтись и получить сигнал в два раза слабее, какое нафиг определение расстояния по силе сигнала, о чем вы?

Ответить
Развернуть ветку
Denis Kiselev

Зачем? Я точно знаю что локация по БС работает путём сопоставления данных с нескольких БС. Работает удовлетворительно, мы пользовались.

Ответить
Развернуть ветку
Michael Smith

Не знаю чем вы там пользовались, но это не триангуляция.
Она во-первых считается по задержкам, во-вторых дает точность в десятки метров. Никаких плюс-минус километров.

Ответить
Развернуть ветку
Denis Kiselev

Мы пользовались системой mpoisk. Я скинул вам ссылку где написано как именно она осуществляет локацию - путём агрегации данных от нескольких БС. Если вам так не хочется говорить об этом как о триангуляции - ок. Вы, видимо, как то узко понимаете этот термин. Ну - ок. Живите с этим пониманием.

Ответить
Развернуть ветку
Michael Smith

Агрегация данных это еще не триангуляция, но не суть, разговор же начинался не про терминологию, а про точность.

Вы начинали с точности "50-150м":

Сам по себе радиомодуль смартфона в твоём кармане показывает твоё местоположение с точностью 50-150м. Сотовые операторы собирают эти данные, государство вполне может их получить.

Я сказал что это бред, что такая точность возможна только при триангуляции и это массово не делают.
В итоге вы дали ссылки, где подтверждается то же, что я говорил – точность плюс-минус километр, что достигается просто по району обслуживания БС.
Я дал ссылки как можно получить такую точность, но технически сложно, надо считать задержки сигнала.

Ответить
Развернуть ветку
Denis Kiselev

Точность определения в городе довольно высока. В пределах нескольких сотен метров точно. По опыту - незначительный разброс от здания где фактически находится устройство. На открытом месте точность возрастает и как раз может дойти до 50-150м.

Что возвращает нас к началу разговора - вполне можно распознавание лиц усилить данными сотовой сети чтобы ограничить круг граждан, которых нужно узнать по камерам.

Ответить
Развернуть ветку
Michael Smith

По вашей же ссылке выше написано, 200-400 метров в центре города, от 1 км на окраинах и за пределами города. Что согласуется с моими словами и не согласуется с вашими.
Точность в 50-150м вы не получите.

Ответить
Развернуть ветку
Denis Kiselev

Умудряются ж как то точность делать выше - вот ссылка - хз про достоверность, нагуглил по-быстрому:

И можно ваше понимание термина триангуляция?

Ответить
Развернуть ветку
Michael Smith

Лол

Дополнительный чип с ПО в мобильном телефоне
Дополнительные фазированные решетки на базовых станциях
Ответить
Развернуть ветку
Denis Kiselev

Это ж древние стандарты рассматриваются! А мы про современные сети говорим! Но даже тогда точность была ничего так.

Насчёт «триангуляции»:

У нас есть возможность получить не только данные CellID базовой станции, на которую подключен абонент, но и данные «соседей» (соседние базовые станции), мы можем повысить точность определения используя триангуляцию – теперь зона, в которой находится абонент уже ограничивается не дальностью действия базовой станции, а симплексом между несколькими базовыми станциями (зачастую это треугольник, вершины которого заданы координатами базовых станций).

Отсюда: https://m.habr.com/ru/company/megafon/blog/167905/

Ответить
Развернуть ветку
Michael Smith
Отсюда: https://m.habr.com/ru/company/megafon/blog/167905/

Почитал, там ничего нового не пишут.
Они так же определяют координаты по зоне обслуживания БС, просто не по одной зоне, а по нескольким соседним БС в области видимости, что дает пятно меньше, но все же сильно большое.

Это нельзя назвать настоящей триангуляцией, это псевдо-триангуляция.
Триангуляция это геодезический термин и это измерение расстояний или углов от объекта до нескольких опорных точек и построение координаты объекта.

Чтобы сделать настоящую триангуляцию надо точно вычислить задержки сигнала GSM до соседних БС (это сложная техническая задача, я дал ссылку выше, где это реализуют).
И тогда координаты находятся не с точность до километров, а с точностью до 30-50 метров.

Вот и такой триангуляции у нас операторы и полиция не делают (по крайней мере массово). Все что они могут – это определить район с точностью до пол-километра/километров.

Ответить
Развернуть ветку
Denis Kiselev

Ну вот все и свелось к терминам. Триангуляция - это таки метод вычисления координат по нескольким опорным углам (три угла).

А вы говорите о радиопеленге - https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D0%B4%D0%B8%D0%BE%D0%BF%D0%B5%D0%BB%D0%B5%D0%BD%D0%B3%D0%B0%D1%86%D0%B8%D1%8F?wprov=sfti1

Ответить
Развернуть ветку
Michael Smith
А вы говорите о радиопеленге

И? Радиопеленг это измерение, координаты потом находят триангуляцией. Там же написано.

Путём радиопеленгации источника с двух и более удаленных друг от друга точек можно определить местоположение источника излучения путём триангуляции.

https://en.wikipedia.org/wiki/Triangulation

Specifically in surveying, triangulation per se involves only angle measurements, rather than measuring distances to the point directly as in trilateration; the use of both angles and distance measurements is referred to as triangulateration.
Ответить
Развернуть ветку
Denis Kiselev

Вы много раз говорили что использование БС для получения координат - не триангуляция. Якобы триангуляция даёт большую точность. Хотя триангуляция - это лишь метод вычислений координат по данным от нескольких пеленгаторов. Геометрическая операция. Вы просто неверно понимаете термин.

А точность позиционирования зависит, конечно, от точности данных от радиопеленгатора. Безусловно. Высокоточным оборудованием, наверное, можно запеленговать мобильник точнее. Но БС дают неплохую точность. В нашей практике - достаточную чтобы понять где сотрудники.

Ответить
Развернуть ветку
Michael Smith
Вы много раз говорили что использование БС для получения координат - не триангуляция.

Это не правда.
Я говорил, что методы, на которые вы ссылались, где определяют координаты по зоне обслуживания БС – это не триангуляция. И я же дал вам ссылку, как делают правильную триангуляцию, именно используя данные БС и вычисляя задержки на них.

Хотя триангуляция - это лишь метод вычислений координат по данным от нескольких пеленгаторов. Геометрическая операция. Вы просто неверно понимаете термин.

Я все понимаю верно, не нужно мне приписывать ваше непонимание термина.
Для этой "геометрической операции" надо знать расстояния или углы, чего вы из логов не узнаете, следовательно все ваши рассуждения про триангуляция по логам идут в топку.

Но это все лирика. Вы уводите обсуждение в сторону, суть была вообще не в этом, суть была, что вы сказали, что оператор знает местоположение с точностью до 50-150 метров, и что ло логам это местоположение всегда можно узнать в прошлом.
Это полная ерунда.

Ответить
Развернуть ветку
Denis Kiselev

Ещё раз: определение задержек и углов - это все вопросы работы радиопеленгатора. Триангуляция - это просто геометрия, обработка результатов. Нет такой операции по геолокации -триангуляция. Есть радиопеленг и много его методов. Отделите мухи от котлет. Или приведите плиз ссылку на определение термина.

Про точность сложно сказать определённо сколько именно метров - данных нет. но на открытом месте в городе точность сильно в пределах пары-тройки сотни метров, что достаточно для дополнительного фактора в улучшении точности распознавания лиц путём сужения выборки. Из базы данных в миллионы людей можно отобрать тысячи по наличию их телефонов в заданном месте. В пределах сотен метров не так много телефонов находится. Насчет логов - конечно, их нужно писать - заблаговременно. Это вполне реально - особенно если используется для системы распознавания лиц.

Ответить
Развернуть ветку
Michael Smith
Или приведите плиз ссылку на определение термина.

Я вам уже выше давал ссылку на определение, да забудьте про триангуляцию, похоже это слишком сложно для вас.

Про точность сложно сказать определённо сколько именно метров - данных нет.

Данные есть и я выше их несколько раз цитировал, из вашей же ссылки на mpoisk.ru

200-400 метров в центре города, от 1 км на окраинах и за пределами города.

Вы уже дурачка включаете. Думаю можно закончить на этом.

Ответить
Развернуть ветку
Michael Smith
А точность позиционирования зависит, конечно, от точности данных от радиопеленгатора.

И опять ерунду говорите, нету никаких пеленгаторов на БС.
Ни точных, ни неточных.
Все что вы узнаете из логов, что в зоне действия БС был абонент, все.
Используя логи нескольких БС можно путем перекрытия зон дейстствия узнать область в радиусом в сотни метров или километры.

Вы ничего нового мне не сообщили.
Это не триангуляция и это не та точность, о которой вы заявили вначале.

Ответить
Развернуть ветку
Denis Kiselev

Ещё раз: в случае определения координат по БС роль радиопеленгатора выполняет БС. Она даёт силу сигнала - по которой определяется примерное расстояние до абонента. Агрегируя данные от нескольких БС триангуляцией вычисляют положение абонента. В статье от мегафона так и написано - триангуляцией. Вы с ними тогда спорьте что они не в теме - с людьми кто сервис разработал.

В зависимости от помех - точность в городе может сильно скакать - в здании абонент или на улице. На улице - по практике-вполне себе точность.

Ответить
Развернуть ветку
Michael Smith
Она даёт силу сигнала - по которой определяется примерное расстояние до абонента.

Не определяется расстояние по силе сигнала. Я уже давал ссылку где это опровергается.
Во-первых застройка и рельеф сильно влияет на силу сигнала, можно пройти пару метров и сигнал изменится в 2 раза.
Во-вторых телефон постоянно меняет силу сигнала, он использует минимально достаточную мощность, чтобы не садить батарею. Следовательно БС никак не может использовать мощность для вычисления расстояния. Даже в чистом поле. Потому что телефон ее постоянно меняет.
И это все есть по ссылке которую я вам дал и которую вы не читали.
Я заканчиваю обсуждение, мы ходим кругами.

Ответить
Развернуть ветку
143 комментария
Раскрывать всегда