В чём заключается концепция «третьей волны открытых данных» и как удержаться на её гребне

В чём заключается концепция «третьей волны открытых данных» и как удержаться на её гребне

Развитие цифровых технологий привело к значительному увеличению объёма данных, которые можно анализировать. Изменения затронули все элементы работы с информацией: сбор, обработку, анализ, дальнейшее распространение и практическое применение полученных результатов. Как следствие, всё больше растёт и обмен данными, в том числе через специальные инфраструктуры, например проекты, предоставляющие доступ к научным данным. Они облегчают работу с информацией на одном или нескольких этапах и решают дополнительные задачи:

  • собирают данные из открытых источников, очищают и обогащают их, приводят к машиночитаемому формату;
  • формируют описание наборов данных, описывают атрибуты и источники данных;
  • предоставляют технические возможности для доступа и работы с данными;
  • публикуют ранее недоступные для исследований данные государственных органов;
  • проводят мероприятия для исследовательского сообщества.

Таким образом, одним из залогов активного и продуктивного обмена данными является их открытость. По убеждению сторонников открытых данных, сведения, полученные от общества, должны быть в общественном распоряжении или по крайней мере доступны для желающих ознакомиться с этими данными. За многие годы активистам в этой области удалось достичь большого прогресса: уже стало привычно, что государства по всему миру публикуют свои данные на специальных порталах в режиме свободного доступа.

Как считают представители Open Data Policy Lab, проекта исследовательского центра The Governance Lab, несмотря на достигнутые успехи в области открытости данных, сохраняются и проблемы. Во-первых, большое количество, возможно, бóльшую часть, данных собирают частные компании. Доступ к таким потенциально полезным сведениям, их перевод в статус открытых данных — непростая задача. Во-вторых, в прошлом приоритетом сторонников открытости были государственные сведения на национальном и международном уровнях, это привело к отставанию и недостатку внимания к информации, которую собирают на региональном и локальном уровнях. В-третьих, нарушение информационных прав граждан, например скандалы, связанные с утечкой личных данных, значительно подорвали доверие к идее открытых данных.

Исследователи полагают, что комплекс инновационных мер позволил бы решить эти проблемы и перевести принципы работы с данными на новый этап развития — в «третью волну открытых данных». Концепция «третьей волны открытых данных» была выдвинута почти год назад, в октябре 2020 года, в статье «Появление третьей волны открытых данных» (The Emergence of a Third Wave of Open Data). За прошедшее время исследователи Open Data Policy Lab представили развитие этой концепции в статье «Набор инструментов для третьей волны открытых данных» (The Third Wave of Open Data Toolkit), опубликованной в марте этого года, а также в августовской публикации «Многоуровневый подход к документированию того, как третья волна открытых данных может принести пользу обществу» (A Layered Approach to Documenting How the Third Wave of Open Data Can Provide Societal Value).

Что такое «волны открытых данных»?

В период пандемии COVID-19 понятие «волна» приобрело негативное значение, ассоциирующееся с новым всплеском заболеваний. Однако в случае открытых данных это понятие несёт, скорее, позитивный смысл. «Волна» — это парадигма, в которой работают специалисты в области открытых данных.

Ключевым элементом «первой волны» было законодательство о свободе информации. Журналисты, юристы и активисты НКО получили возможность направлять прямые запросы государственным органам власти и тем самым раскрывать засекреченные данные, представляющие интерес для общества. Прежде всего они работали с информацией национального значения.

«Вторая волна» началась, когда должностные лица отдельных стран мира приняли решение раскрыть часть информации и предоставить к ней доступ с помощью специальных порталов открытых данных. Государства стремились повысить уровень открытости: с помощью данных ведомства, крупные корпорации и небольшие компании могли найти решения общественных проблем. Пример такого решения — разработка приложений для транспортной системы Лондона.

Как считают представители Open Data Policy Lab, «третья волна» связана с появлением новых подходов к обработке информации. По их мнению, главное отличие от предыдущих лет заключается в целевом раскрытии данных. В новых условиях фокус сместится с «открытости ради открытости» на формирование наиболее полезных и запрашиваемых датасетов. Спрос на данные будет иметь столь же большое значение, сколь и их доступность, а роль контекста, в котором организации собирают и применяют данные, будет лишь возрастать.

В чём заключаются особенности «третьей волны»?

По мнению исследователей, у нового периода будет четыре отличительных черты, которые позволят развить достижения прошлых лет и дополнить уже сложившиеся структуры работы с данными.

Целевое раскрытие

Для работы с данными необходимо затратить финансовые, технические и человеческие ресурсы. Объём этих ресурсов ограничивает возможности не только тех, кто предоставляет данные, но и тех, кто нуждается в информации. Понимание того, что в условиях ограниченности ресурсов экспертам необходимо расставлять приоритеты, лежит в основе «третьей волны». Как считают в Open Data Policy Lab, вместо того чтобы производить данные и выкладывать их, надеясь, что их кто-то найдет, необходимо установить связь с пользовательским сообществом и узнать их запросы.

Эксперты Центра перспективных управленческих решений (ЦПУР), а также платформы «Инфраструктура научно-исследовательских данных» (ИНИД) проводят подобные исследования, в частности, изучают то, насколько открытые данные ведомств соответствуют запросам общества. К примеру, в аналитической записке «Открытые данные в дипломатии: Россия в контексте международного опыта», в котором в числе прочего рассматриваются открытые данные МИД России, делается вывод: «МИД России также следует более активно способствовать использованию своих открытых данных другими стейкхолдерами, прежде всего исследователями, СМИ, общественными организациями».

Сотрудничество в области данных

В ходе «третьей волны» расширится круг сторон, работающих с данными, а сотрудничество между ними будет укрепляться. Изучению данных будут всё больше уделять внимание общественные и некоммерческие организации, малый бизнес, местные власти и другие стороны, которые могут применять полученные сведения на локальном уровне. Исследователи считают, что в этом им могут помочь специалисты в области данных, которые будут играть более значимую роль во время принятия решений.

Совместные проекты в области данных, которые объединяют силы государственного и частного секторов, будут иметь большое значение во время «третьей волны». Как считают исследователи, новые модели сотрудничества на их основе позволят идентифицировать и продуктивно работать с данными коммерческих компаний, обладающими большим общественным значением.

Открытость региональных данных

В прошлом эксперты по открытости основное внимание уделяли данным национального и международного масштаба. В условиях «третьей волны» всё большее значение получат данные регионального масштаба. Сведения, которые собирают на уровне городов и регионов, обладают более высоким уровнем детализации и практическим значением, а значит, с их помощью можно прямо повлиять на жизнь граждан.

Ответственная работа с данными и защита информационных прав

Если в период первых двух «волн» специалисты отмечали угрозу нарушения права граждан на приватность информации, то во время «третьей волны» им придется разбираться с бóльшим числом проблем. К примеру, с последствиями предвзятого подхода при анализе данных или с негативным эффектом от применения датасетов.

Исследователи считают, что в этой ситуации защита приватности не должна приводить к негативным последствиям. Некоторые организации и страны предпочитают не раскрывать данные, аргументируя это защитой приватности и безопасностью, что приводит к дополнительным сложностям при работе с информацией и замедляет появление инноваций. В период «третьей волны» сообществу исследователей открытых данных предстоит сформировать правила, чтобы они учитывали такие риски.

В сентябре этого года ЦПУР в рамках проекта ИНИД представил аналитический обзор международного опыта институционализации доступа исследователей к разным типам микроданных, которыми обладают органы государственной власти. Из-за рисков раскрытия чувствительной информации такие данные, как правило, не публикуются и требуют использования специальных организационных и инфраструктурных механизмов для установления доступа к ним. В обзоре предложена типология, включающая в себя три основных модели доступа к таким данным, а также модель институционализации доступа, оптимальная для современной России.

Как вызвать «третью волну»: тенденции и набор инструментов

Чтобы «поймать» «третью волну», исследователям открытых данных нужно понять, из каких тенденций она состоит, и применить определённые инструменты для усиления этих тенденций и соответствия им. Представители Open Data Policy Lab провели интервью с экспертами из государственных ведомств, частного сектора и общественных организаций и выявили восемь тенденций, определяющих новый подход к обеспечению открытости информации, а также подобрали инструменты, применение которых поможет «оседлать» каждую из них.

Создание и развитие информационных ресурсов для распределения объёмов ведомственных данных

Организации, работающие с открытыми данными, как правило, делегируют эту задачу отдельным командам, в чьих руках консолидируются навыки и ресурсы с информацией. Изоляция от других команд не предоставляет им возможности достаточно влиять на повседневную деятельность организации.

В качестве одного из решений исследователи предлагают распределять специалистов, обладающих навыками работы с открытыми данными, по различным отделам, это может помочь преодолеть институциональные барьеры. Целенаправленные усилия по инвестированию, развитию и распространению навыков работы с данными могут помочь организации основываться на фактических данных и систематизировать все свои операции.

Осознание ценности и влияния открытых данных и создание базы с информацией о доказанном влиянии

Первые две «волны» во многом опирались на абстрактные аргументы о ценности права на доступ к общественной информации и его важности. Сила этих аргументов слабеет, когда в бюджете не хватает средств на открытость. Отраслевым руководителям, правительственным чиновникам и общественности бывает просто необходимо понимать, какую ощутимую пользу принесут им инвестиции в открытые данные. Иначе открытые данные не будут восприниматься как важная потребность, а будут выглядеть ещё одним «полезным дополнением». Часто лучше обратиться непосредственно к интересам организаций или отдельных личностей, чтобы дать простые объяснения того, как открытые данные поддержат достижение их целей.

Также важно показать, как раскрытие данных приводит к положительным результатам на практике, например через экономический рост. В связи с этим Open Data Policy Lab предлагает собирать информацию о примерах успешного решения проблем с помощью данных. Примеры таких решений из разных стран собирает команда ЦПУР в рамках проекта Доказательная политика.

Новые посредники данных и их поддержка

Как считают исследователи, важную роль будут играть посредники, которые могут оптимизировать затраты на работу с данными. Посредники данных могут расширять возможности организаций и поддерживать работу с открытыми данными, предоставляя необходимые ресурсы, будь то безопасные платформы для совместной работы и обмена данными или поддержка в составлении соглашений о совместном использовании данных.

По мнению исследователей, посредники данных могут наладить связь между сторонами, которые обладают данными и которые нуждаются в них, а также предоставить техническую поддержку всем акторам. Одним из примеров таких посредников выступает платформа ИНИД, целью которой является обеспечение продуктивного взаимодействия между владельцами данных о государстве и обществе и исследователями для принятия управленческих решений на основе данных и для совершенствования государственной политики.

Создание структуры управления данными: регуляция и чёткие правила

Организации часто не понимают, как управлять данными в разных ситуациях, и поэтому действуют в условиях неопредёленности, в том числе и правовой. В государственном секторе такие проблемы выражаются на всех уровнях: национальном, международном и особенно на региональном. Компаниям из коммерческого сектора тоже не всегда понятно, с какими данными и партнёрами можно работать без нарушения юридических норм. Определение этих норм — приоритет в период «третьей волны».

На протяжении всего жизненного цикла данных, включая этапы сбора, хранения, подготовки, обмена, анализа и использования, акторы могут оценивать риски и стремиться к их предотвращению. Эта концепция называется сквозной ответственностью за данные, и она важна для обеспечения доверия и пресечения возможности нанесения вреда. Организации могут поощрять обеспечение мер безопасности в отношении данных правительственными, межправительственными и международными органами или создавать порталы для облегчения повторного использования данных. Так, специалисты ИНИД уже занимаются разработкой стандартов деперсонификации данных для юридической и методологической поддержки госорганов при работе с данными.

Создание технической инфраструктуры для повторного использования данных

Наиболее популярными методами обмена информацией в «первую волну» были веб-формы и электронные письма, а во «вторую волну» — порталы открытых данных. Хотя формат портала открытых данных, вероятно, останется общим местом технической инфраструктуры, приоритетом «третьей волны» будет оптимизация уже сложившейся инфраструктуры, повышение её технологического уровня и введение общих стандартов данных.

Межотраслевые, междисциплинарные исследования и разработки будут способствовать такому усовершенствованному технологическому развитию. Новые и сложные технические разработки могут сподвигать к более ответственному повторному использованию данных и более тесному сотрудничеству. Такие разработки могут включать улучшенные вычислительные мощности для анализа больших наборов данных и новые и безопасные способы передачи данных.

Содействие формированию и развитию компетенций в работе с публичными данными

При работе с данными нельзя забывать об интересах общества: люди не только пользуются открытой информацией, но и раскрывают сведения о себе. Чем больше людей будут знать основы науки о данных, тем больше они смогут влиять на политику обработки информации.

Чтобы гарантировать ответственное использование данных и технологий, важно, чтобы как выгоды, так и связанные с ними риски оценивались заинтересованными сторонами. Организации могут поддержать усилия по повышению компетентности в работе с публичными данными, не только делая доступными данные, но и создавая сопроводительную документацию на понятном языке без использования жаргонизмов.

Контроль, мониторинг и разъяснение принятых решений и предоставленных данных

История принятия решений и подробная информация о них являются ключом к снижению рисков и наиболее эффективному повторному использованию данных. Недостаточная прозрачность того, каким образом стороны собирают данные и как принимают решения на их основе, сокращает возможность узнать, какие меры могли бы снизить риски.

С помощью прозрачности можно в большей степени избегать негативных последствий от работы с данными. Организации могут установить информацию обо всех решениях, которые влияют на сбор, обработку, анализ, совместное использование и повторное использование данных, а также обо всех сторонах, которые влияют на принятия этих решений. Через это организации могут понять, почему системы существуют именно в таком виде, и соответственно реагировать, когда эти системы не дают желаемых результатов.

Создание проводников данных

Проекты «третьей волны» будут нуждаться в институциональной поддержке. Как считают в Open Data Policy Lab, главным структурным сдвигом станет появление новых ролей и зон ответственности. Проводники данных (data stewards) и старшие проводники данных (chief data stewards) могут стать лидерами, которые будут распознавать возможности в области сотрудничества и распространения информации.

Некоторые государства организуют межведомственные команды по работе с открытыми данными или нанимают экспертов по развитию этого направления. Организации могут продвигать эффективные методы работы с данными, назначив отдельную команду или отдельного человека для управления совместной работой с данными.

Многоуровневый подход к документированию того, как «третья волна открытых данных» может принести пользу обществу

Структура открытых данных (Open Data Framework), разделённая на слои, похожие на репчатый лук в разрезе, показывает все процессы, которые используются для извлечения пользы из данных в ходе «третьей волны». Эта «луковая модель» демонстрирует, как организации могут создавать пользу для общества, делая свои данные доступными для повторного использования другими сторонами.

Первый слой — жизненный цикл данных — описывает процессы сбора, обработки, распространения, анализа и использования данных. Второй слой описывает расширение доступа к данным за счет совместной работы. Третий слой фокусируется на глубоком понимании процессов через обработку данных. Четвёртый слой описывает благоприятные условия для работы с данными. Пятый слой даёт определение ценности данных для общества. Последний, шестой слой, описывает приоритетные действия, которые будут работать на развитие концепции «третьей волны открытых данных», они же и есть те восемь инструментов, которые описаны выше.

#данные #анализданных #открытыеданные #наукаоданных #данныедляисследователей

11
Начать дискуссию