Всё, что не прибито. Как запретить AI обучаться на вашем сайте

Как вы уже и без того знаете, нейросети собирают дату для обучения, в том числе в эту базу без проблем попадёт и ваш сайт. Своруют всё, что не прибито. Что будет стянуто? Всё: статьи, картинки, фотографии. Всё, что по идее как бы охраняется авторским правом. Рассмотрим возможности защиты от парсинга.

Защита на стороне сервера

Некоторые хостинговые компании предлагают решения, блокирующие заходы ии-агентов. Если ваш сервер работает не через управление панелью, вы можете при желании установить дополнительные программные барьеры.

Также можно вручную добавлять все ip агентов в чёрный список, но для этого придётся шерстить логи.

Создание инструкций

Недавно появился стандарт создания инструкции по типу robots.txt, но для нейросетей. В корне сайта создаётся файл ai.txt и заполняется подобно роботс.

По идее это должно давать понять что вы запрещаете обход.

Но будет ли оно так реально работать, это хороший вопрос. Потому что такие запреты и разрешения - это по сути рекомендации, а не чёткие барьеры.

Кроме этого, на самом сайте, в футере, можно приписать, что вы запрещаете использовать все материалы на сайте для обучения ИИ и вообще для любого коммерческого использования без вашего письменного согласия.

Мы нашли спасение?

Запретить прямой обход и сбор даты можно при желании. Но это работает и не работает одновременно.

Арт можно пробовать защищать инструментами Чикагского университета (вы найдёте эти инструменты в поиске при желании), но честно говоря у меня есть сомнения в том, насколько это рабочая идея. Если вы никогда ничего не выкладывали в Интернет, и первая же ваша работа сразу с защитой, то оно сработает против обучения, данные будут отравлены. Но всё не так просто. Об этом я хочу сделать отдельный материал, где разберу причины.

Представьте себе, что некий Вася решил-таки использовать вашу собственность, с первого раза у него не вышло, и он просто пошёл на ваш сайт, сдёрнул с него все тексты и картинки, самостоятельно скормил это нейросетям.

Шах и Мат.

От такого спастись можно только полный уходом в тень, если писать, фотографировать и рисовать только в стол. Ну и надеяться, что такие воришки будут преданы анафеме.

Почему авторское право не работает с ИИ?

Проблема в том, что пока мало где законодательно признали создание нейросетей - коммерческой разработкой. Но, например, в Австралии, суд постановил, что создание таких моделей - это коммерческая деятельность, а значит обучение моделей никоим образом не попадает под добросовестное использование.

Так что проблема в законе, который в силу бюрократии и других причин банально не успевает "очухаться". В США каким-то чудом всё это приравнено к добросовестному использованию. Я уж молчу, что там пытались протащить билль о регистрации авторского права на промпт или даже установить правообладателем компанию или даже компьютер. Но идея провалилась, так как в авторском праве уже давно устоялось правило «Обезьяньего селфи» (Monkey Self-Portrait Rule).

1
1
Начать дискуссию