Всё, что не прибито. Как запретить AI обучаться на вашем сайте
Как вы уже и без того знаете, нейросети собирают дату для обучения, в том числе в эту базу без проблем попадёт и ваш сайт. Своруют всё, что не прибито. Что будет стянуто? Всё: статьи, картинки, фотографии. Всё, что по идее как бы охраняется авторским правом. Рассмотрим возможности защиты от парсинга.
Защита на стороне сервера
Некоторые хостинговые компании предлагают решения, блокирующие заходы ии-агентов. Если ваш сервер работает не через управление панелью, вы можете при желании установить дополнительные программные барьеры.
Также можно вручную добавлять все ip агентов в чёрный список, но для этого придётся шерстить логи.
Создание инструкций
Недавно появился стандарт создания инструкции по типу robots.txt, но для нейросетей. В корне сайта создаётся файл ai.txt и заполняется подобно роботс.
По идее это должно давать понять что вы запрещаете обход.
Но будет ли оно так реально работать, это хороший вопрос. Потому что такие запреты и разрешения - это по сути рекомендации, а не чёткие барьеры.
Кроме этого, на самом сайте, в футере, можно приписать, что вы запрещаете использовать все материалы на сайте для обучения ИИ и вообще для любого коммерческого использования без вашего письменного согласия.
Мы нашли спасение?
Запретить прямой обход и сбор даты можно при желании. Но это работает и не работает одновременно.
Арт можно пробовать защищать инструментами Чикагского университета (вы найдёте эти инструменты в поиске при желании), но честно говоря у меня есть сомнения в том, насколько это рабочая идея. Если вы никогда ничего не выкладывали в Интернет, и первая же ваша работа сразу с защитой, то оно сработает против обучения, данные будут отравлены. Но всё не так просто. Об этом я хочу сделать отдельный материал, где разберу причины.
Представьте себе, что некий Вася решил-таки использовать вашу собственность, с первого раза у него не вышло, и он просто пошёл на ваш сайт, сдёрнул с него все тексты и картинки, самостоятельно скормил это нейросетям.
Шах и Мат.
От такого спастись можно только полный уходом в тень, если писать, фотографировать и рисовать только в стол. Ну и надеяться, что такие воришки будут преданы анафеме.
Почему авторское право не работает с ИИ?
Проблема в том, что пока мало где законодательно признали создание нейросетей - коммерческой разработкой. Но, например, в Австралии, суд постановил, что создание таких моделей - это коммерческая деятельность, а значит обучение моделей никоим образом не попадает под добросовестное использование.
Так что проблема в законе, который в силу бюрократии и других причин банально не успевает "очухаться". В США каким-то чудом всё это приравнено к добросовестному использованию. Я уж молчу, что там пытались протащить билль о регистрации авторского права на промпт или даже установить правообладателем компанию или даже компьютер. Но идея провалилась, так как в авторском праве уже давно устоялось правило «Обезьяньего селфи» (Monkey Self-Portrait Rule).