Cloudflare выпустила инструмент против ботов, которые собирают с сайтов данные для обучения ИИ

Он доступен без платной подписки.

  • Найти его можно в настройках безопасности — в разделе «Боты» (Security и Bots), рассказала компания. По её словам, некоторые разработчики собирают данные без разрешения, обходя даже ограничения, и не платят за то, что используют их для тренировки своих моделей.
  • Алгоритмы Cloudflare должны отлавливать в том числе тех роботов, которые «маскируются» под пользователя, просто зашедшего на страницу.
  • Компания также создала форму, через которую владелец сайта может самостоятельно сообщить о нежелательных ботах для сбора данных, которых Cloudflare по какой-то причине не может остановить.
Опция называется AI Scrapers & Crawlers
Опция называется AI Scrapers & Crawlers
  • В июле 2023 году Google включила собственные модели в список сервисов, которые могут обучаться на общедоступных данных. В сентябре разрешила владельцам сайтов настраивать доступ к данным, которые можно и нельзя использовать для обучения. То же позже сделала и OpenAI.
88
11
29 комментариев

Глупость конечно все эти запреты.

Сам человек свободно изучает труды, литературу, существующие работы художников, обучается на них.

Сначала подражает известным, учится на них, и в итоге спустя время создает уже что-то своё.
И всем это ок.

Тоже самое делает сетка, но это вдруг не ок.
Двойные стандарты

10
3
Ответить

Человечки тревожатся. Банально из-за принципиально разной скорости обработки информации. Сетка-то при наличии ресурсов что угодно прожует. И быстро. А человечек - нет

3
1
Ответить

Ничего не поняла 😵
Но их капча меня уже задолбала.
На каждом сайте ее пихают 💁‍♀️

8
Ответить

поддерживаю)

4
Ответить

Долой капчу! Даешь интернет свободный от капчи!

2
Ответить

Даа
уже везде они, по 20 раз за день капчу проходить приходится

Ответить

Любые боты, в том числе ведущие сбор инфы для обучения ИИ или нейросетей, это прежде всего нагрузка на сервера для владельцев сайтов. Такой бот чаще всего не монетизируется через рекламные инструменты, то есть не приносит владельцу сайта никакой выгоды. Поэтому это нормально, чтобы запретить таким ботам использовать ресурсы и мощности владельца площадки. Запрещают в первую очередь из-за лишней нагрузки, а не из-за того, чтобы они не читали его авторский контент. Пусть эти боты "тренируются на кошках".

4
Ответить