Этика обращения с данными: опыт Мегафон и Accenture

Леонид Чёрный из Мегафон и Михаил Садофьев из Accenture поделились своим опытом и наблюдениями по этике работы с данными в рамках проекта Конспекта DAMA DMBOK2. Приводим ключевые мысли.

Компания Qlik, совместно с проектом DataLiteracyProject, нацеленного на популяризацию навыков грамотной работы с данными, ведет общественный и просветительский проект Конспекта Свода знаний DAMA DMBOK2.

Конспект «DAMA DMBOK2» знакомит сообщество с наиболее актуальными подходами в управлении данными, собранными Международной ассоциацией управления данными DAMA. Конспект – это выжимка основных идей, которые публикуются примерно раз в месяц на сайте проекта.

Выход конспекта по каждой главе сопровождается онлайн-обсуждением с экспертами из бизнеса и консалтинга. Такой подход помогает обогатить теоретический материал конспекта практикой: личным опытом, советами и ценными мнениями.

Вторая глава DAMA DMBOK2 посвящена вопросу этики обращения с данными. В рамках проекта мы поговорили с Леонидом Чёрным – CDO «Мегафон», и Михаилом Садофьевым – руководителем направления продвинутой аналитики Accenture в России, о вопросах этики использования данных в России и в мире.

Общее видение этики работы с данными

Этика обращения с данными – комплекс мер по обеспечению соответствия практик получения, хранения, управления, интерпретации, анализа, применения и ликвидации данных общечеловеческим этическим принципам, включая ответственность перед обществом

Леонид Чёрный: Данные сами по себе находятся вне этичной или неэтичной категории, они просто существуют. В Мегафоне мы разрабатываем политики этики работы с данными, но мы их так не называем. У нас есть определённый набор регламентов, который регулирует практики и подходы к получению данных, их хранению и управлению. И что особенно важно в enterprise-среде – регулирует подходы к использованию, анализу и применению данных.

Михаил Садофьев: Вопрос этики и безопасности очень плотно живет в любой международной корпорации, тем более в публичной. Особенно на Западе вопрос этичности или неэтичности компании, может быть, более важен, чем продукт компании и компетенции, которыми она обладает. Понимание того, как используется информация и как она защищается формирует доверие конечных потребителей. Понимание процессов управления данными и понимание самих данных, которые есть у компании – важный фундамент. Если компания не знает какие данные у нее есть, то и нечем управлять.

Леонид Чёрный: Если говорить, каким образом этика работы с данными в принципе появляется в компании, то важно понимать, что она появляется исходя из прецедентов. Сразу вспоминается пример с Cambridge Analytics. Та практика которая была применена в работе с данными в той цели и в той бизнес-логике, получила общественное осуждение. Если общество считает что-то неприемлемым, это становится правилом, которые компания добавляет в свои регламенты. Никто не хочет отвечать перед Сенатом США.

Кодекс этики использования данных

В 2019 году, в Центре Международной Торговли в рамках Недели российского интернета (RIW-2019), был подписан Кодекс этики использования данных. На сегодняшний день, Кодекс подписали крупнейшие компании российского рынка, включая Яндекс, Qiwi, Тинькофф, Ростелеком, Mail.ru, Мегафон, Сбербанк, МТС, Вымпелком, Газпромбанк, Газпром-Медиа Холдинг и ВТБ. Кодекс открыт для новых участников, готовых поддержать декларируемые принципы и нормы.

Кодекс этики использования данных разработан Ассоциацией больших данных и Институтом развития интернета и представляет собой свод отраслевых стандартов профессионального и этического поведения, которые его участники признают и обязуются соблюдать. Прочитать кодекс можно здесь.

Леонид Чёрный: Объем данных внутри этой группы компаний и организаций – фантастический, он огромный. Эти большие игроки пришли к мысли, что им, как драйверам рынка, нужно договориться между собой: что считать правильным, а что считать неправильным. В итоге, появился документ – набор основополагающих принципов, который все участники Ассоциации больших данных считают приемлемым для себя. Это набор ежедневных практик и логик применения. У кодекса есть будущее – это не высеченный в камне скрижаль, это живой документ, который дорабатывается и постоянно обсуждается. К нему постоянно присоединяются новые участники. Это определенный набор тезисов, который работает на светлое будущее.

Прогноз для рынка в России и СНГ

Леонид Чёрный: Если обращаться к международной практике, то, на мой взгляд, крен все больше и больше идет не к тому, что компании сами начнут внутри себя что-то придумывать и создавать. Скорее, будет усиливаться роль государственного регулирования, в том числе в области работы с данными. Мы прекрасно это видим на примере GDPR (General Data Protection Regulation, Общий регламент по защите данных).

То есть, первые пару лет – как это было с GDPR – происходит набор прецедентной базы, где, например, локальное законодательство вступает в противоречие с общеевропейским. С одной стороны, ты обязан хранить персональные данные в течение, кажется, 3-х лет, после того как пользователь перестал быть твоим клиентом. При этом, у тебя есть надгосударственный акт, который запрещает тебе эти данные хранить, если пользователь высказал желание, что они не должны быть доступны.

У нас в России прецедентного права нет, но у нас нормативные акты – в большинстве случаев, если они касаются регуляторных областей – вступают в действие отстрочено с момента подписания. Эта отсрочка появилась не просто так. Это как раз для того, чтобы можно было привести в соответствие имеющиеся информационные системы и подготовится к новым нормам.

Риски неэтичного использования данных

Михаил Садофьев: В моем опыте, мы яростно выявляли все места, где есть ручной ввод информации. С точки зрения дата-процессинга (на примере банка), каждая точка ручного ввода информации может создавать риски. Если нельзя эту точку автоматизировать, это место должно быть выявлено и там должна быть персональная ответственность.

Продвинутые организации за рубежом, у которых есть своя продуктовая линейка, действительно могут отладить весь процесс работы с данными для конкретного продукта, но в рамках одной продуктовой линейки. Вряд ли можно сказать тоже самое про всю компанию. Потому что данных очень много. Компании действуют по принципу необходимого и достаточного, пока нет влияния извне.

Леонид Чёрный: В моем опыте, мы готовим данные и гарантируем, что они корректные. У нас есть огромное количество проверок на каждом этапе подготовки данных. Начиная от проверок Data Quality при пересчете агрегатов, заканчивая условными чекерами, которые стоят между источником данных и корпоративным хранилищем. Они гарантируют, что пуля, которая вылетела из точки А это та же самая пуля, которая прилетела в точку Б.

Я с высокой определенностью могу отвечать за то, что данные корректны. Это то, что ложится в понятие этики данных – данные не подвергаются осознанным искажениям, не используются для манипуляций.

Леонид Чёрный, CDO Мегафон

Специально обученные люди (аналитики, бизнес-аналитики, финансовые аналитики) работают над интерпретацией этих данных, но они доверяют мне и доверяют настроенным у меня проверкам. Они не ставят под сомнение то, что данные корректны.

Регламент – это самая плохая история, которую можно делать. Самая хорошая история – сформировать у людей привычку.

Леонид Чёрный, CDO Мегафон

Каждый занимается своей непосредственной работой. Это позитивно влияет например, на показатель Time-2-Market с точки зрения всего процесса. И, конечно, влияет на бизнес, потому что бизнес, базируясь на данных, принимает осознанные решения о том, что будет происходить дальше.

Регламент – это самая плохая история, которую можно делать. Самая хорошая история – сформировать у людей привычку. Во-первых, привычку думать об этом. Во-вторых, привычку использовать знания о том, что стоит за термином этичность в своей повседневной рабочей деятельности. Формирование подобной привычки это то, во что я и мои коллеги вкладываемся.

Подробнее про этику работы с данными в DAMA DMBOK2 можно прочитать на странице главы.

А подробное видео онлайн-дискуссии с Леонидом Чёрным и Михаилом Садофьевым в рамках проекта смотрите здесь.

0
1 комментарий
Екатерина Григоренко

Ну пару кейсов по формированию привычки можно?))))

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда