Куплю данные самовывозом: зачем биржи обезличенной информации нужны нашему бизнесу

Без накопления и использования больших данных сегодня не может существовать ни один бизнес: на их базе ритейл планирует ассортимент, банки изучают спрос на кредиты, поставщики оптимизируют производство. Но что будет, если они станут использовать не только свои данные, а начнут покупать их у других компаний? Разбираемся в этой статье.

Куплю данные самовывозом: зачем биржи обезличенной информации нужны нашему бизнесу

Каждый день в мире появляется около 400 терабайт новых данных. Но главным препятствием к их использованию и обработке остается то, что в правовом поле компании не могут обмениваться наборами друг с другом. Хотя их легальная монетизация способна не только породить целый новый вид бизнеса, но и существенно ускорить развитие data-ориентированных компаний.

И все же в некоторых юрисдикциях уже смогли создать необходимые регуляторные новеллы и сформировать открытый рынок обезличенных данных. Можем ли мы перенести этот опыт в Россию? Своими мыслями делится генеральный директор Platforma Андрей Тотмаков.

Ничего личного

Когда мы говорим о сборе персональных данных в целях развития бизнеса, мы всегда подразумеваем именно обезличенную информацию, предназначенную для обработки машинными методами. Инструментов анонимизации существует немало, но для нас важно не это, а то, что только такой формат позволяет избежать критических утечек, крайне востребованных цифровыми мошенниками.

Именно такое условие создает фундамент для развития самих механизмов их обогащения. Поэтому сейчас в России ведется активная совместная работа Ассоциации больших данных и ФСТЭК по выработке отраслевых стандартов обезличивания персональных данных. Следующий шаг — создание инструментов их передачи между государственными, исследовательскими и частными организациями.

В мире уже давно идут дискуссии о том, как именно должен выглядеть механизм обмена такими наборами данных. Пока что самый лучших из придуманных — публичная биржа для частных компаний, где они могут продавать свои и покупать чужие массивы для последующей обработки.

Биржи бывают двух видов. Формат маркетплейса хорош тем, что работает как витрина, где бизнес может быстро сориентироваться в категории необходимого ему продукта и совершить сделку в рамках закона —, но сама биржа при этом несет лишь информативную функцию и никак не отвечает за качество данных и их использование. Второй вид подразумевает, что такая биржа носит функцию экспертного провайдера услуг между бизнесами или государством и бизнесом, помогая им с решением бизнес-задач, поиском необходимых наборов данных и юридическими консультациями.

Отличие двух подходов состоит в том, что первый позволяет быстрее сформировать открытый рынок и дать организациям доступ к востребованному продукту, но такой рынок будет по-настоящему диким, и об интересах простых людей его участники будут думать в последнюю очередь. Второй подход естественным образом замедлит развитие этого рынка как минимум из-за бюрократических препонов и длительной разработки правовой базы.

Чтобы ответить на вопрос, какой из этих двух форматов нам больше нравится, проведем эксперимент. Просто представьте, как бы выглядел фондовый рынок, на котором нет никаких регуляторных норм. Стали бы вы отдавать свои деньги брокерам, не прошедшим строгую проверку специалистами Центробанка, покупать ценные бумаги компаний, чья отчетность не проходит внешнего аудита, и фиксировать покупку через рукопожатие, а не запись в реестре депозитария? Ответ очевиден.

Как у них

Китай принимает активное участие в развитии идеи биржи данных с самого начала, поэтому к настоящему моменту страна успела накопить огромный опыт в этом деле. Первые попытки внедрить такой механизм Китай предпринял в Пекине еще в 2014-м, но развить проект в полноценно функционирующий маркетплейс тогда не удалось, хотя объемы торгов и достигли около 1 млрд юаней в год (почти 164 млн долларов по тому курсу).

Спустя шесть лет в Гуйяне появился аналогичный проект, и он оказался намного успешнее — годовой объем торгов составил уже 5 млрд юаней (почти 690 млн долларов). Но при оценке рынка в 20 млрд юаней он все еще не оправдывал всех ожиданий.

Проблема была в том, что многие компании опасались таких сделок именно из-за отсутствия четких регламентов. Тогда же стало понятно, что для полноценного запуска обменных механизмов нужно решить четыре проблемы: принять единые стандарты авторских прав, создать устойчивые механизмы передачи и аналитики больших данных, внедрить строгие правила оценки качества наборов данных и принять все необходимые законы для защиты обычных граждан от дешифровки и разглашения их личной информации.

Отраслевой закон появился очень быстро — уже в следующем году. Во многом, как отмечают эксперты, он повторял положения европейского GDPR, но при этом не ограничивал бизнес в определении привлекательных для себя рынков торговли наборами анонимизированных данных. Вступление в силу новой правовой нормы стало драйвером взрывного роста торговли обезличенными данными: благодаря этому всего за два года с запуска биржи в Гуйяне общий объем рынка удвоился до 12,3 млрд долларов, а к 2025-му ожидается очередное удвоение до 28,8 млрд долларов и роста до 72,6 млрд долларов к 2030-му.

Как у нас

Российские компании уже давно активно используют большие данные в своей работе — лидирующими секторами, очевидно, являются финансовые услуги и розничная торговля. Согласно исследованию профильного института ВШЭ, такие технологии уже применяют или скоро начнут 35,5% компаний. Но при этом 58,5% из них собирают данные самостоятельно, а обмен ими с другими компаниями не входит даже в десятку самых популярных способов их получения.

И все же создание качественного механизма для обмена данных между компаниями очень востребовано в нашей стране: при том, что четверть готова покупать наборы данных у третьих лиц, почти каждый пятый бизнес не прочь монетизировать накопленную им за годы работы информацию о поведении и предпочтениях своих клиентов. Тем более, уже существующее законодательство в отношении персональных данных разрешает компаниям хранить их и использовать для развития технологического фундамента, но только если они готовы гарантировать безопасность пользователей.

Но отсутствие общепринятого механизма, закрепленного в качестве обязательных для всех участников рынка правовых норм, существенно тормозит этот процесс. Чтобы легально заключить сделку по продаже набора обезличенных данных между двумя компаниями, необходимо чуть ли не с нуля проработать все юридические моменты и закрепить их в договоре — на это уходит полгода и больше. Конечно, устоявшиеся партнерские связи между двумя компаниями впоследствии упростят и ускорят эту процедуру, но все равно ее нужно будет проводить с самых основ с любым другим контрагентом — именно поэтому более половины компаний при сборе данных в первую очередь рассчитывают на собственные силы.

Главным государственным трендсеттером в этом вопросе остается Минцифры. В начале 2024 года ведомство опубликовало проект постановления, принятие которого позволит создать специализированную площадку-репозиторий на основе «Единой информационной платформы национальной системы управления данными».

Идея в том, чтобы размещать на ней обезличенные наборы данных различных госведомств и открыть к ним доступ заинтересованным коммерческим организациям и исследовательским институтам. Такой подход, к примеру, позволит страховым компаниям разработать более качественные скоринговые модели с помощью анализа информации, зафиксированной дорожными камерами.

Эта инициатива позволит создать прецедент и определить общие правила игры для всего рынка, а впоследствии — настроить частные механизмы обмена данными между различными организациями, не только государственными. Причем сами системы могут быть исключительно межотраслевыми, а не полностью публичными. Благодаря их запуску бизнес сможет сократить издержки на проверку своих гипотез, сделать свои товары и услуги более клиентоориентированными, а общий экономический эффект от этого повысит объемы налоговых поступлений от корпоративного сектора вместе с ростом выручки.

Развить перспективную практику обмена наборами обезличенных данных сейчас можно еще быстрее, чем это сделали в Китае. Для этого достаточно воспользоваться релевантным опытом других стран и уже на его основе запустить собственные проекты.

1414
44
3 комментария

В который раз убеждаюсь что анонимность в наше время это чистая фикция и роскошь которая практически никому недоступна.

1
Ответить

публичная биржа для частных компаний, где они могут продавать свои и покупать чужие массивы для последующей обработки.Не обесценит ли такой подход данные? Возможно, что базы будут просто выжжены

Ответить

Очень интересная статья, спасибо!

Ответить