Google разрешила владельцам сайтов отказываться от использования их данных для обучения ИИ

До этого так же поступила OpenAI.

  • Компания представила инструмент Google-Extended. Его можно настроить через документ robots.txt, который сообщает веб-сканерам о том, к какой информации они могут получить доступ.
  • Издатели смогут скрыть свои ресурсы от роботов, которые собирают данные для обучения моделей Bard и VertexAI. При этом сайты продолжат индексироваться поиском Google.
  • По мере расширения технологий ИИ компания также намерена предлагать владельцам сайтов новые возможности по контролю за доступом к данным. О каких возможностях идёт речь — не уточняется.
  • В июле 2023 года Google обновила политику конфиденциальности, включив свои модели ИИ в список сервисов, которые могут обучаться на общедоступных данных из интернета.
  • В августе OpenAI разрешила владельцам сайтов блокировать доступ к данным для своего сканера GPTBot через robots.txt.
1313
62 комментария

Быть умным это вовремя прикинуться тупым

2

В духе "Страховщика" (2014) и "Иску́сственного ра́зума" (2001)

отличный маркер для роботов что как раз на скрываемых данных и надо обучаться

5

А как заставить нейронки обучаться на свих сайтах? Куда заявление писать? В Госуслугах пока раздела нет.

4

Пока что нужно подать письменное заявление в МФЦ, берёте талончик и ждёте своей очереди. При себе важно иметь паспорт и СНИЛС

3