«Инспектор конфиденциальности сайтов»: как работает и зачем нужен американский сервис Blacklight Статьи редакции

Инструмент от The Markup позволяет понять, сколько на самом деле информации о пользователе собирают сайты.

Когда пользователь посещает какой-то сайт он не должен удивляться, что у него будет «компания» — не только в виде других пользователей, но и в виде инструментов, которые владелец страницы использует для идентификации читателей, пишет Forbes.

Обычно эти инструменты работают незаметно, пока в какой-то момент пользователь не видит рекламу на ту же тему, то он изучал. Браузеры, такие как Mozilla Firefox и Safari, блокируют многие из этих трекеров, но далеко не все.

Поэтому разработчик и журналист некоммерческого новостного сайта The Markup Сурья Матту (Surya Mattu) создал инструмент Blacklight — «инспектора конфиденциальности сайтов в реальном времени».

Как работает Blacklight

Для начала сканирования пользователь должен ввести адрес сайта. После этого сервис определит, какие трекеры используются на сайте, и предоставит отчёт пользователю.

Согласно описанию, Blacklight использует программное обеспечение, созданное The Markup, и проводит тесты, определяя, есть ли на сайте один из семи методов отслеживания:

  • Сторонние cookie-файлы.
  • Рекламные трекеры.
  • Отслеживание Facebook.
  • Отслеживание Google Analytics.
  • Запись сеанса.
  • Кейлоггеры.
  • Canvas fingerprinting.

Blacklight записывает все URL-адреса, которые запрашивает проверяемый сайт, а также составляет список всех запрошенных доменов и поддоменов. Сервис не сохраняет эту информацию без разрешения пользователя, отмечают в The Markup.

Результаты Blacklight для каждого запрошенного сайта кэшируются в течение 24 часов — сохранённые отчёты предоставляются по запросам других пользователей для этого же сайта. Это сделано, чтобы злоумышленники не использовали инструмент для «завала» сайтов тысячами автоматических посещений.

Также сервис сообщает пользователям, на сколько результат запрашиваемого сайта совпадает со средним результатом 100 тысяч самых популярных сайтов в рейтинге Tranco.

Создатели сервиса отмечают, что Blacklight не определяет цель отслеживания, а также как именно сайт использует собранные данные. Кроме того, инструмент не проверяет условия использования и политики конфиденциальности сайтов, поэтому не может определить, публично ли они используют трекеры или скрывают их от пользователей.

У Blacklight открытый исходный код, он доступен на Github.

Как могут использоваться данные

На сайте журнала Time есть 14 трекеров, 25 cookie-файлов, трекеры Facebook и Google, а также запись сеанса — в том числе регистрация кликов мыши и прокрутка страницы, пишет Recode со ссылкой на результаты теста Blacklight.

Это может показаться более жутким, чем есть на самом деле, отмечает издание. Сайты могут использовать собранные данные для изучения поведения пользователей, чтобы улучшить интерфейс страницы или её работу.

Некоторые из инструментов, которые отслеживает Blacklight, могут использоваться владельцами сайтов вовсе не во вред пользователю, подтверждает Forbes. Например, запись сеанса может помочь определить дочитываемость страницы, а для функции автозаполнения может использоваться кейлоггинг.

Пользователю может быть всё равно, какие сведения о нём собирает новостной сайт, но его мнение может измениться, когда речь идёт о более личной информации, указывает Recode. На медицинском сайте WebMD сервис Blacklight обнаружил 26 трекеров, 31 cookie-файл и трекер Facebook.

Проверка сайта webmd.com редактором vc.ru показала другой результат

Forbes отмечает, что из всех перечисленных инструментов, наиболее «вредным» методом отслеживания действий может считаться Fingerprinting. Браузеры Safari, Firefox и Microsoft Edge блокируют его по умолчанию в дополнение к сторонним cookie-файлам. Google также обещала предпринять дополнительные меры для его блокировки в Chrome.

Сам The Markup утверждает, что собирает минимальное количество информации о пользователях и не делится этими данными с третьими лицами. Проверка Blacklight и Firefox подтвердили это, отмечает Forbes.

«Blacklight — не идеальный и не единственный критерий для определения конфиденциальности. Это игра в кошки-мышки с компаниями, разрабатывающими инструменты для отслеживания», — считает The Washington Post.

Но пользователи могут использовать сервис, чтобы понять, доверять ли сайту, или чтобы оценить заявления главы компании, который «кричит», что «конфиденциальность — право человека», указывает издание.

0
16 комментариев
Написать комментарий...
33_rublya

Респект VC! :)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Lovkiy D

респект другому сайту, а 5 трекеров это не мало :)

Ответить
Развернуть ветку
33_rublya

Сообщение удалено

Ответить
Развернуть ветку
Кирилл Таран

Непонятно, чем отличается от стандартных функций адблоков

Ответить
Развернуть ветку
Apitan

Мне вот вполне понятно, что он делает (показывает: вот, смотрите, за вами оказывается следят!). Мне не понятно, что в этом толку и чего они пытаются добиться.
Достаточно просто считать, что каждый первый сайт собирает всё, до чего может дотянуться, и вы не ошибетесь в 99%. И если даже сам сайт эти данные не собирает, за него заботливо это сделают различные скрипты, кнопки соц.сетей и т.п.

Ответить
Развернуть ветку
Pavel Raspaev

самое ужасное, что я встречал на сайтах за 20 лет в интернете:
- записывают поля ввода в формах заказа, и потом пишут/смс/звонят, если ты оттуда ушёл не заказав (раз 5 может было, последний раз был неделю назад)
- однажды мне написал менеджер в личку в вк, после посещения сайта веб-студии. при этом я ничего нигде не вводил, не нажимал лишние кнопки (кроме навигации)

в личных разговорах с владельцами таких сервисов/сайтов, они говорят что это помогает повышать конверсию, но лично у меня каждый раз возникает максимальное отвращение и отсутствие какого-либо желания пользоваться их услугами.

Ответить
Развернуть ветку
Vikarti Anatra
записывают поля ввода в формах заказа, и потом пишут/смс/звонят, если ты оттуда ушёл не заказав (раз 5 может было, последний раз был неделю назад)

Мне это встречалось пару раз. у одного и того же сайта. 
Перезванивали с вопросом почему не продолжили и в ответ получали ответ почему и пояснили (логично) почему в данном случае это не проблема совсем. 
Конверсию свою кстати получили.
Но! от этой конторы вообщем то такие фокусы вполне ожидаемы, позиционируются как технические продвинутые и современные. 

И даже если на VC упомянуть по имени - приходят и ответы пишут -:).

Ну и телефон при штатном пользовании их услугами все равно давать пришлось бы, нужен он там. 
А вот незапрошенных звонков или сообщений на почту от них не было вообще ни разу. 

Ответить
Развернуть ветку
Кирилл Таран

Мне понятно тоже, что делают, а не понятно, в чём УТП

Ответить
Развернуть ветку
Lovkiy D

Ghostery же есть

Ответить
Развернуть ветку
Apitan

Ghostery - зло.

Ответить
Развернуть ветку
Павел Крафт

Обоснуйте.

Ответить
Развернуть ветку
Apitan

То, что они прозрачно собирают пользовательские данные, не отменяет этого сбора данных. Да, там есть галочка, чтобы это отключить... Но тогда зачем он вообще нужен-то?
https://lifehacker.com/ad-blocking-extension-ghostery-actually-sells-data-to-a-514417864
Кроме того, он плох тем, что он блокирует только "хорошие" трекеры, а не все подряд, как какой-нибудь uBlock origin.

Ответить
Развернуть ветку
Lovkiy D

Ок, аналог?

Ответить
Развернуть ветку
Apitan

для блокировки рекламы - uBlock origin
для блокировки социальных виджетов и прочих трекеров - доп. фильтры (активируются в самом uBlock origin)

Показывает, кто за Вами шпионит? Хз. uBlock origin показывает только домены, к которым подключается сайт - мне этого вполне достаточно.

Ответить
Развернуть ветку
Женя Гагарин

подскажите, чем ? 

Ответить
Развернуть ветку
13 комментариев
Раскрывать всегда