Метаданные имеют значение: разгребаем хаос из digital материалов

Всем привет! Меня зовут Сергей Фомин, я CEO IT-разработчика Picvario. Мы делаем сервис, который систематизирует – читай, наводит порядок в корпоративных фото, видео и аудио. Сегодня я расскажу, почему в цифровую эпоху не выжить без метаданных, и поделюсь несколькими инсайтами о будущем работы с контентом.

Дипфейки, синтетический контент, инклюзивность в медиа и NFT – уже наша реальность, которая стремительно развивается.

Метаданные имеют значение: разгребаем хаос из digital материалов

Содержание

Метаданные: что это и для чего они нужны

О подводных камнях в работе с медиа материалами я знаю не понаслышке – уже 20 лет я руковожу фотоагентством. Больше 5 тыс. фотографий из нашего архива ежедневно используют российские и зарубежные СМИ.

В digital эру мы в целом генерируем гигантское количество контента. Чтобы вы понимали – в среднем человек производит 1,7 мб контента в секунду! И это с учетом, что у 35% человечества еще нет доступа к интернету.

Чтобы как-то ориентироваться во всех производимых цифровых материалах, используются метаданные – они уточняют основную информацию о файле.

Информация записываются внутри самих файлов или в файлах сопровождения: XML, XMP, JSON и др. С помощью метаданных пользователь в прямом смысле «считывает», зачем, когда и где был создан медиафайл, и можно ли его вообще использовать.

<i>Рис.1. Пример заполненных полей метаданных с текстовой информацией о файле.</i>
Рис.1. Пример заполненных полей метаданных с текстовой информацией о файле.

Существуют разные типы метаданных, самые распространенные из них – EXIF и IPTC/XMP.

EXIF метаданные содержат в основном техническую информацию о цифровом файле – настройках камеры в момент создания снимка. Стандарт включает информацию о геолокации, модели камеры, режиме вспышки, формате файла, дате и времени его создания и т. д.

<i>Рис.2. Пример метаданных стандарта EXIF</i>
Рис.2. Пример метаданных стандарта EXIF

Однако, EXIF включает лишь сухие факты о настройках оборудования – этих данных недостаточно для понимания предназначения медиафайла. Лирика спрятана в метаданных формата IPTC/XMP. Стандарт содержит более 200 полей метаданных, тем самым лучше раскрывает саму суть файла: что на нем изображено, его название, описание, назначение, дата создания, ключевые слова – теги, и другую информацию.

Особое внимание уделяется и авторству контента – можно указать, кто создатель, условия лицензии на фото или видео.

<p><i>Рис.3. Информация, которую содержат IPTC/XMP метаданные изображения.</i></p><p><i>Источник: iptc.org</i></p>

Рис.3. Информация, которую содержат IPTC/XMP метаданные изображения.

Источник: iptc.org

Краткий экскурс в IPTC/XMP

Стандарт IPTC/XMP был разработан еще в конце 60-х группой новостных медиа – Международным Советом по Прессе и Телекоммуникациям. В настоящее время в организацию входят более 60 представителей СМИ, включая таких гигантов, как Adobe, Agence France-Presse, Bloomberg, Reuters, Getty Images и др.

Я и сам являюсь представителем Совета Европейских Медиаагентств (CEPIC) в организации IPTC и участвую в разработке стандарта. Само собой, наше ПО Picvario поддерживает стандарты IPTC. В этом смысле это одно из преимуществ нашего IT-решения Picvario, что мы сами участвуем в развитии стандарта метаданных, влияющих на всю индустрию управления цифровыми медиафайлами.

С переходом в цифровой век при пересылке фото или видеоматериалов часто терялись данные о медиафайле: его название, описание, информация об авторстве контента и т. д. Основная цель организации сегодня – развить и распространить в отрасли стандарты для обмена данными об активах.

Кстати, можете на практике посмотреть, какие метаданные содержатся в ваших фотографиях, и при необходимости, отредактировать их через нашу бесплатную программу MetaEditor.

<i>Рис.4. Пример метаданных стандарта IPTC/XMP</i>
Рис.4. Пример метаданных стандарта IPTC/XMP

Системы для чтения и заполнения метаданных

Практически все проф ПО умеет работать с метаданными IPTC/XMP, например, Adobe Photoshop, Bridge, ACDSee и др. Это касается и отдельно разработанных DAM-систем – в том числе и Picvario. Мы изначально разрабатывали платформу, поддерживающую уже существующие стандарты.

Приведем пример использования систем управления медиаконтентом. Редактору медиа присылают фотографии и видео с места событий. Далее он должен оперативно транслировать эти материалы в более низком разрешении новостникам для публикаций, а оригиналы поместить в архив. При этом важно обязательно указать копирайтинг и данные о лицензии на использование изображений. Хорошая новость – все эти операции с контентом можно провести через DAM-системы.

Нужно сказать, что DAM давно уже используют за пределами одних только СМИ. Инструменты организации медиаконтента с успехом применяют в учебных заведениях, маркетинговых агентствах, производственных предприятиях и т. д. Все большое распространение набирает практика использования DAM в организациях культурного наследия: галереях, библиотеках, архивах и музеях.

Так, в 2018 году из-за отсутствия системы хранения контента, случилась страшная трагедия в сфере искусства. В Национальном Музее Бразилии случился пожар, в котором сгорели и были безвозвратно утеряны более 20 млн экспонатов. При наличии платформы DAM у музея, удалось бы сохранить цифровые копии предметов искусства.

Развитие цифровой (не) реальности

Члены и специалисты IPTC/XMP активно лоббируют и развивают инклюзивность стандарта метаданных. В последнем релизе IPTC/XMP появилось поле Alt Text и в дополнение к нему Extended Description.

Нововведения касаются слабовидящих и незрячих людей – в мире их больше 320 млн. В Alt Text можно внести описание об изображении – эту информацию программы чтения с экрана трансформируют в аудиальную, и люди с нарушением зрения могут «увидеть» картинку, фотографию или другой визуальный контент. Отмечу, что поле Alt Text интегрировано и в системе Picvario.

Есть и другие темы, которые стоят на повестке дня. Так, этой весной представители IPTC/XMP обсуждали современные вызовы работы с медиаконтентом.

Одна из актуальных тем – роль метаданных для NFT. Для контекста – NFT это цифровой актив, который можно купить и продать. Его цена определяется ценностью объекта: это может быть изображение, картина, видео, первый твит в истории и т. д. И вот чтобы NFT представлял ценность на рынке – нужны метаданные, описывающие характеристики актива.

На IPTC/XMP встрече поднимались и другие острые темы в мире цифровых технологий: например, применение искусственного интеллекта (ИИ) для создания синтетического контента. Сегодня мы можем представить себе что угодно, ИИ способен воссоздать любую нашу фантазию.

<i>Рис.5. Первая виртуальная модель Шуду Грэм, созданная на базе системы ИИ. Источник: instagram.com</i>
Рис.5. Первая виртуальная модель Шуду Грэм, созданная на базе системы ИИ. Источник: instagram.com

Еще одна тема последних лет, о которой не пишет только ленивый – совершенствование производства дипфейков. Если раньше на создание реалистичного дипфейка уходило много времени и тонна видеоматериалов, сегодня создавать его уже можно в прямом эфире. Многим политикам, селебрити и другим медийным личностям уже не до смеха – для борьбы с фейками и аутентификации цифровых изображений была создана коалиция C2PA. Туда вошли медийные гиганты – Microsoft, Adobe, BBC, Intel и др. Ожидается, что производитель контента будет присваивать активам цифровой сертификат, фиксирующий информацию о его первичном формате, объеме, владельце и т. д.

По словам Хани Фарида – специалиста в области компьютерных наук из Калифорнийского университета, он был уверен, что на создание «живых» дипфейков потребуется примерно пять лет. Практика показала – он был неправ, пугающе реалистичные модели стали создавать уже спустя два года.

В любом случае цифровые технологии открывают грандиозные возможности для человечества, главное – смотреть во все глаза и внимать, чтобы ничего не прозевать.

22
Начать дискуссию