«Инспектор конфиденциальности сайтов»: как работает и зачем нужен американский сервис Blacklight

Инструмент от The Markup позволяет понять, сколько на самом деле информации о пользователе собирают сайты.

Когда пользователь посещает какой-то сайт он не должен удивляться, что у него будет «компания» — не только в виде других пользователей, но и в виде инструментов, которые владелец страницы использует для идентификации читателей, пишет Forbes.

Обычно эти инструменты работают незаметно, пока в какой-то момент пользователь не видит рекламу на ту же тему, то он изучал. Браузеры, такие как Mozilla Firefox и Safari, блокируют многие из этих трекеров, но далеко не все.

Поэтому разработчик и журналист некоммерческого новостного сайта The Markup Сурья Матту (Surya Mattu) создал инструмент Blacklight — «инспектора конфиденциальности сайтов в реальном времени».

«Инспектор конфиденциальности сайтов»: как работает и зачем нужен американский сервис Blacklight

Как работает Blacklight

Для начала сканирования пользователь должен ввести адрес сайта. После этого сервис определит, какие трекеры используются на сайте, и предоставит отчёт пользователю.

Согласно описанию, Blacklight использует программное обеспечение, созданное The Markup, и проводит тесты, определяя, есть ли на сайте один из семи методов отслеживания:

  • Сторонние cookie-файлы.
  • Рекламные трекеры.
  • Отслеживание Facebook.
  • Отслеживание Google Analytics.
  • Запись сеанса.
  • Кейлоггеры.
  • Canvas fingerprinting.

Blacklight записывает все URL-адреса, которые запрашивает проверяемый сайт, а также составляет список всех запрошенных доменов и поддоменов. Сервис не сохраняет эту информацию без разрешения пользователя, отмечают в The Markup.

Результаты Blacklight для каждого запрошенного сайта кэшируются в течение 24 часов — сохранённые отчёты предоставляются по запросам других пользователей для этого же сайта. Это сделано, чтобы злоумышленники не использовали инструмент для «завала» сайтов тысячами автоматических посещений.

Также сервис сообщает пользователям, на сколько результат запрашиваемого сайта совпадает со средним результатом 100 тысяч самых популярных сайтов в рейтинге Tranco.

Создатели сервиса отмечают, что Blacklight не определяет цель отслеживания, а также как именно сайт использует собранные данные. Кроме того, инструмент не проверяет условия использования и политики конфиденциальности сайтов, поэтому не может определить, публично ли они используют трекеры или скрывают их от пользователей.

У Blacklight открытый исходный код, он доступен на Github.

Как могут использоваться данные

На сайте журнала Time есть 14 трекеров, 25 cookie-файлов, трекеры Facebook и Google, а также запись сеанса — в том числе регистрация кликов мыши и прокрутка страницы, пишет Recode со ссылкой на результаты теста Blacklight.

Это может показаться более жутким, чем есть на самом деле, отмечает издание. Сайты могут использовать собранные данные для изучения поведения пользователей, чтобы улучшить интерфейс страницы или её работу.

Некоторые из инструментов, которые отслеживает Blacklight, могут использоваться владельцами сайтов вовсе не во вред пользователю, подтверждает Forbes. Например, запись сеанса может помочь определить дочитываемость страницы, а для функции автозаполнения может использоваться кейлоггинг.

Пользователю может быть всё равно, какие сведения о нём собирает новостной сайт, но его мнение может измениться, когда речь идёт о более личной информации, указывает Recode. На медицинском сайте WebMD сервис Blacklight обнаружил 26 трекеров, 31 cookie-файл и трекер Facebook.

Проверка сайта webmd.com редактором vc.ru показала другой результат
Проверка сайта webmd.com редактором vc.ru показала другой результат

Forbes отмечает, что из всех перечисленных инструментов, наиболее «вредным» методом отслеживания действий может считаться Fingerprinting. Браузеры Safari, Firefox и Microsoft Edge блокируют его по умолчанию в дополнение к сторонним cookie-файлам. Google также обещала предпринять дополнительные меры для его блокировки в Chrome.

Сам The Markup утверждает, что собирает минимальное количество информации о пользователях и не делится этими данными с третьими лицами. Проверка Blacklight и Firefox подтвердили это, отмечает Forbes.

«Blacklight — не идеальный и не единственный критерий для определения конфиденциальности. Это игра в кошки-мышки с компаниями, разрабатывающими инструменты для отслеживания», — считает The Washington Post.

Но пользователи могут использовать сервис, чтобы понять, доверять ли сайту, или чтобы оценить заявления главы компании, который «кричит», что «конфиденциальность — право человека», указывает издание.

1313
16 комментариев

Респект VC! :)

3
Ответить

Комментарий недоступен

Ответить

респект другому сайту, а 5 трекеров это не мало :)

Ответить

Непонятно, чем отличается от стандартных функций адблоков

1
Ответить

Мне вот вполне понятно, что он делает (показывает: вот, смотрите, за вами оказывается следят!). Мне не понятно, что в этом толку и чего они пытаются добиться.
Достаточно просто считать, что каждый первый сайт собирает всё, до чего может дотянуться, и вы не ошибетесь в 99%. И если даже сам сайт эти данные не собирает, за него заботливо это сделают различные скрипты, кнопки соц.сетей и т.п.

4
Ответить

Ghostery же есть

2
Ответить

Ghostery - зло.

Ответить