Парсинг и интеллектуальная собственность: есть ли нарушение?
Парсинг – автоматизированный сбор информации с сайтов, широко используемый в IT-бизнесе.
С одной стороны, парсинг позволяет с меньшими издержками создавать множество коммерческих продуктов, с другой стороны, может привести к нарушению интеллектуальных прав.
Что стоит учесть, чтобы минимизировать риски при сборе информации со сторонних ресурсов – рассказывают Наталия Леонтьева, юрист практики цифрового права ЮК «Зарцын и партнеры», и Владислав Арнаутов, младший юрист практики цифрового права ЮК «Зарцын и партнеры».
Кратко о парсинге
Парсинг – технология автоматического сбора информации в сети Интернет. Благодаря парсингу можно оперативно проанализировать цены и ассортимент товаров конкурентов или собрать отзывы о ваших услугах. Парсинг также позволяет на основе собранной информации создавать и выводить на рынок новые решения. Например, на данных из социальных сетей, собранных в ходе парсинга, основываются многие продукты по оценке кредитоспособности.
Но у парсинга, как и у всех современных технологий, есть две стороны. Оптимизируя сбор информации, можно нарушить права на интеллектуальную собственность третьих лиц. Особенно вероятны такие нарушения при создании на основе парсинга самостоятельных продуктов.
Когда парсинг нарушает интеллектуальные права
Данные, которые являются объектом парсинга, можно разделить на две категории: неохраняемые (как правило, носящие информационный характер и не требующие творчества при создании, например курсы валют ЦБ РФ, цены на товары, информационные сообщения, данные о погоде и так далее) и охраняемые, к которым, в частности, относятся объекты авторских и смежных прав.
При парсинге могут нарушаться права на следующие охраняемые объекты:
- права на отдельные материалы (например, статьи, фотографии на сайтах) как на самостоятельные произведения, охраняемые авторским правом;
- права на базы данных, которые могут охраняться в качестве объектов авторского или смежного права.
Нарушение прав на самостоятельные произведения (тексты, фотографии и пр.)
Если в созданном продукте без согласия правообладателя используется охраняемый контент (тексты, фотографии и пр.), то это с высокой долей вероятности будет признано нарушением. Использованием будет считаться, например, размещение охраняемого контента на сайте вашего продукта, внутри разработанной программы и т.д.
Тем не менее, использование чужих произведений может быть правомерным, если такие действия будут подпадать под случаи свободного использования (основная применимая норма – ст. 1274 ГК РФ). Однако важно учесть, что свободное использование может позволять использовать только ограниченный объем произведения, требовать ссылок на первоисточник, указания имени автора и т.д. Полагаться на свободное использование стоит, если вы уверены в соблюдении всех его критериев.
Кроме того, в ряде случаев сами владельцы сайтов разрешают копирование своих материалов. Например, владелец сайта может разрешить использование контента на условиях открытой лицензии (Creative Commons и др.). Как правило, информация о согласии владельца сайта на использование материалов размещается на самом сайте, в том числе в условиях пользовательского соглашения.
Нарушение прав на базы данных
При парсинге также извлекаются и используются материалы баз данных, которыми последняя правоприменительная практика признает сами сайты.
В базе данных как объекте авторского права охране подлежит творческий подбор или расположение материалов (п. 2 ст. 1260 ГК РФ), при этом авторско-правовая охрана базы данных не распространяется на использование отдельных материалов, вошедших в ее состав. Нарушить права на базу данных можно, заимствуя всю структуру сайта, что на практике происходит крайне редко.
Гораздо более вероятным является нарушение прав на базу данных как на объект смежного права, поэтому остановимся на этом вопросе подробнее.
В отличие от авторско-правовой охраны, охрана базы данных в качестве объекта смежного права позволяет правообладателю ограничивать извлечение и использование из базы данных отдельных материалов.
Чтобы было нарушение должно быть:
- наличие охраняемого объекта, которое действующая редакция ГК РФ связывает с наличием существенных затрат на создание базы данных;
- факт извлечения и дальнейшего использования материалов из базы данных;
- извлечение существенной части материалов из базы данных или неоднократное извлечение и дальнейшее использование несущественной части материалов из базы данных, если такие действия противоречат нормальному использованию базы данных и ущемляют необоснованным образом интересы правообладателя.
Наличие существенных затрат
База данных становится объектом смежных прав и получает правовую охрану, если она является результатом существенных финансовых, материальных, организационных или иных вложений (инвестиций) изготовителя базы в ее создание. При отсутствии доказательств иного, базой данных, создание которой требовало существенных затрат, признается такая база данных, которая содержит не менее десяти тысяч самостоятельных информационных элементов (материалов).
Отметим, что действующая правоприменительная практика часто усматривает в создании сайтов наличие существенных затрат, поскольку такое создание требует вложений в информационную и техническую инфраструктуру, персонал, рекламу и т.д.
Факт извлечения и дальнейшего использования материалов из базы данных
Под извлечением материалов из базы данных понимается их перенос на другой информационный носитель с использованием любых технических средств (п. 1 ст. 1334 ГК РФ). Следовательно, если вы размещаете материалы с других сайтов на своем ресурсе, в своей программе, в своем мобильном приложении, перенос будет иметь место.
Извлечение существенной части материалов из базы данных
Извлечение и дальнейшее использование материалов из базы данных будут считаться нарушением исключительного права изготовителя базы данных, если извлечение будет осуществляться в отношении всего содержания базы данных или существенной части ее материалов (п. 1 ст. 1334 ГК РФ).
Для определения существенности извлекаемой части материалов используются два критерия:
- количественный (учет соотношения количества извлеченных материалов и общего количества материалов в базе данных; отметим, что немногочисленная судебная практика считает количественной существенностью извлечение около половины материалов);
- качественный (в рамках этого критерия оценивается, насколько извлеченные материалы важны для базы данных в целом).
Извлечение и использование несущественной части материалов
Если из базы данных извлекается и в дальнейшем используется несущественная часть материалов, то это также может быть признано нарушением, если извлечение будет неоднократным, будет противоречить нормальному использованию базы данных и необоснованным образом ущемлять интересы правообладателя.
Неоднократность может быть установлена, если парсинг осуществляется в отношении одного ресурса несколько раз, что происходит, например, с целью актуализации информации. Противоречие нормальному использованию и ущемление интересов правообладетеля оцениваются, как правило, с позиции сути сайта, который подвергся парсингу, и созданного на основе парсинга продукта. Например, если парсинг приводит к созданию конкурирующего продукта, противоречие нормальному использованию и ущемление интересов правообладателя, скорее всего, будет установлено. Если же созданный продукт никак не посягает на клиентскую базу владельца сайта и решает проблему в иной сфере, риск установления нарушения становится существенно ниже.
Лайфхаки для минимизации рисков
С учетом вышесказанного, перед применением парсинга рекомендуется оценить:
- какие из собранных материалов и каким образом вы планируете использовать?
- являются ли полученные в ходе парсинга материалы охраняемыми объектами?
- разрешено ли правообладателем материалов их использование, подпадает ли их использование под случаи свободного использования?
- какую часть материалов вы извлекаете с сайтов? является ли извлечение однократным / неоднократным?
- создавая собственный продукт, конкурируете ли вы с владельцем сайта?
Ответы на эти вопросы позволят лучше взвесить все риски и решить, какой сайт стоит парсить, а какой – нет.
Больше кейсов и статей для IT бизнеса в нашем ТГ канале
Вебинар о проблемах парсинга и ответственности:
Интенсив о регистрации в реестре отечественного ПО (для юристов и бизнеса):