Exif 3.0. Новый выпуск стандарта метаданных изображений

Ассоциация продуктов для камер и изображений CIPA (с англ. Camera & Imaging Products Association) анонсировала новую версию стандарта EXIF 3.0.

Exif 3.0. Новый выпуск стандарта метаданных изображений

EXIF (англ. Exchangeable Image File Format ) позволяет добавлять к изображениям дополнительную информацию или метаданные, описывающие условия и способы создания изображения, авторство, геолокацию, дату и время съемки и т. п. В большинстве своем EXIF предоставляют набор метаданных с упором на данные, передаваемые с камеры. Информация, записанная по этому стандарту, может использоваться как пользователем, так и различными устройствами, например, операционными системами и система управления файлов. Стандарт разрабатывается японской ассоциацией CIPA, которая существует более 20 лет занимается техническими вопросами фотографии. Постоянными членами ассоциации являются Canon, Apple, Nikon, Fujifilm, Sony, Panasonic и другие крупные бренды.

Первая версия стандарта Exif была выпущена в 1995 году, а предыдущий релиз 2.32 - в 2019 году. В новую версию внесены серьезные изменения, поэтому создатели сочли необходимым увеличить основной номер версии - 3.0.

Этим выпуском Ассоциация разрешила такие вопросы:

Об этих вопросах и рекомендациях по синхронизации разных стандартов поговорим в этой статье.

Почему мы считаем это важным?

Меня зовут Сергей Фомин, я профессиональный фотограф (посмотрите мой авторский проект “Полет над Россией”), генеральный директор экосистемы продуктов Picvario, которая работает с большим объемом изображений: мы более 20 лет предлагаем услуги фото- информационного агентства и стокового ресурса, а с 2019 года занимаемся разработкой системы управления контентом DAM Picvario.

Пользователями и потребителями метаданных являются миллионы человек, иногда даже не осознавая это. Самый простой пример - поисковые системы, которые “считывают” метаданные изображений и формируют вашу поисковую выдачу.

Exif 3.0. Новый выпуск стандарта метаданных изображений

Что касается профессиональной практики, то заполнение метаданных изображений - это обязательное требование для создателей контента, которые хотят распространять свои фотографии на известных стоках. Без них фотографии попросту не пройдут модерацию и не будут опубликованы.

Почему площадки так требовательны? Причина проста - потребители контента не смогут найти нужный файл без метаданных. СМИ, дизайнеры, маркетологи и др. используют для поиска текстовые запросы, при этом поиск осуществляется как раз по соответствию запроса метаданным международных стандартов - Exif, IPTC, xmp. Важность метаданных сложно описать в одном абзаце: ранее мы писали лонгрид, заходите узнать подробнее.

Итак, что изменилось в новом выпуске Exif 3.0

1. Мультиязычные текстовые свойства стандарта

Проблема: Текстовые поля, такие как «Авторское право» и «Исполнитель», по требованиям стандарта должны были быть в формате ASCII. Из-за этого возникала проблема с текстовыми полями. Если их заполняли не на английском языке, данные не читались при передаче с устройства на устройство.

На практике это означало, что:

● пользователи были вынуждены заполнять поля либо только на английском, либо оставлять поля пустыми

● некоторые программные пакеты игнорировали стандарт и использовали другие наборы символов, нарушая спецификацию.

Решение: В Exif 3.0 представлен новый тип данных «UTF-8», который позволяет поддерживать мультиязычные наборы символов, от русского и греческого до китайского и арабского.

2. Уникальные идентификаторы

Проблема: Свойство стандарта ImageUniqueID было неточным: не были описаны требования к размерности поля. Из-за этого у ПО возникали проблемы с обработкой - чтением и записью свойства. (прим. ImageUniqueID - уникальный идентификатор стандарта EXIF, который устанавливается камерой во время съемки).

Решение: Предложен алгоритм обработки свойства:

  • Поле должно быть записано как строка ASCII в шестнадцатеричной системе счисления, эквивалентная 128-битному UUID фиксированной длины в соответствии с ISO/IEC 9834-8. (прим. ASCII - название кодировки, набора, в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды).
  • Универсальный уникальный идентификатор или UUID должен быть версии 1 или версии 4, при этом рекомендуется использовать UUID версии 4. Этот идентификатор присваивается в момент съемки изображения, и записанный идентификатор не обновляется и не стирается при последующем редактировании.

3. Когда и как значения свойств exif могут быть изменены или удалены

Проблема: В метаданных EXIF автоматически с камеры записывается конфиденциальная информация, например, данные GPS. Чтобы избежать рисков публичного размещения конфиденциальных данных, особенно это касается при съемке с камер смартфонов, пользователи удаляют ВСЮ информацию из метаданных EXIF. Из-за этого программное обеспечение не может осуществлять постобработку изображения. Одной из причин такой потери информации было то, что спецификацией предыдущей версии стандарта не было регламентировано, какие свойства важны для постобработки, а какие могут быть отредактированы или удалены.

Решение: Новый релиз Exif 3.0 добавляет новое Приложение H. «Руководство по обработке информации свойств при постобработке прикладным программным обеспечением», в котором метаданные группируются по:

● категориям: метаданные, связанные со структурой изображения; метаданные, связанные с условиями съемки; и метаданные, содержащие другую информацию.

● по рангу в зависимости от того, когда они должны быть изменены или удалены, если вообще должны.

Exif 3.0. Новый выпуск стандарта метаданных изображений

Новую спецификацию «CIPA DC-008-Translation-2023 Сменный формат файла изображения для цифровых фотоаппаратов: версия Exif 3.0» можно загрузить с сайта https://www.cipa.jp/std/documents/download_e.html?DC- 008-Перевод-2023-E .

Полный список изменений в Exif 3.0 читайте по ссылке на сайте https://iptc.org/news/exif-3-0-released-featuring-utf-8-support/

Синхронизация свойств из разных стандартов

Как мы упоминали выше, существуют несколько международных стандартов изображений: самые распространенные Exif, IPTC/xmp. Последние два, в отличии от exif с техническими данными о фотографии, представляют описательную информацию: кто и что изображено на фотографии, имя модели и разрешения на распространение файлов, инструкции по использованию и лицензированию и т.д..

Однако, назначение некоторых свойств разных стандартов одинаковое. Для сохранения данных, избежания перезаписи и/или дублирования информации разработчиками стандартов было создано Руководство по синхронизации, которое определяет, какие именно свойства должны быть согласованы.

Руководство поясняет, как синхронизировать четыре словаря метаданных:

● Метаданные IPTC Photo, в том числе модель обмена информацией IPTC-IIM

● Метаданные стандарта XMP (adobe)

● Метаданные стандарта Exif

● Словарь Schema.org, который предоставляет набор свойств метаданных для структурирования данных в Интернете. Схемы представляют собой теги HTML-кода, в которые интегрируются метаданные.

Таблица с рекомендациями по синхронизации <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2F1TLDCZ2RmeoFBW1TuOF0LFLgpZ3PZRQLpuj58QFUESfI%2Fedit%3Fusp%3Dsharing&postId=731888" rel="nofollow noreferrer noopener" target="_blank">по ссылке</a>.
Таблица с рекомендациями по синхронизации по ссылке.

Заключение

Несмотря на то, что меняется стандарт EXIF, новый релиз затрагивает и другие международные стандарты, в частности IPTC/xmp. Picvario, как представитель IPTC сообщества, в настоящее время работает над согласованием полей синхронизации стандарта. Проект Руководства по сопоставлению полей стандартов и инструкция к нему по ссылке https://docs.google.com/document/d/1HLZtublVflXM4x5hj8LsX8WjjOQqvLAZZXfM7cj0kJA/edit?usp=sharing

Крупные бренды-производители техники понимают, как важно научить разное ПО “говорить на одном языке”, поэтому мы как разработчики системы для управления контентом постоянно следим за рекомендациями международных ассоциаций.

В то время как гайдлайны стандартов метаданных носят рекомендательный характер, на практике это must have для всех, вовлеченных в работу с медиа - фотографов, дизайнеров, СМИ, и, разумеется, разработчиков ПО, таких как наша компания Picvario.

44
Начать дискуссию