Google разрешила владельцам сайтов отказываться от использования их данных для обучения ИИ Статьи редакции

До этого так же поступила OpenAI.

  • Компания представила инструмент Google-Extended. Его можно настроить через документ robots.txt, который сообщает веб-сканерам о том, к какой информации они могут получить доступ.
  • Издатели смогут скрыть свои ресурсы от роботов, которые собирают данные для обучения моделей Bard и VertexAI. При этом сайты продолжат индексироваться поиском Google.
  • По мере расширения технологий ИИ компания также намерена предлагать владельцам сайтов новые возможности по контролю за доступом к данным. О каких возможностях идёт речь — не уточняется.
  • В июле 2023 года Google обновила политику конфиденциальности, включив свои модели ИИ в список сервисов, которые могут обучаться на общедоступных данных из интернета.
  • В августе OpenAI разрешила владельцам сайтов блокировать доступ к данным для своего сканера GPTBot через robots.txt.
0
62 комментария
Написать комментарий...
Вадим Д.

А как заставить нейронки обучаться на свих сайтах? Куда заявление писать? В Госуслугах пока раздела нет.

Ответить
Развернуть ветку
Иван Дэвидсон

Скоро будет. Повсюду будет ещё одна кнопка/галка о согласии использовать свои сведения для машинного обучения.

Это помимо "я согласен на обработку персональных данных", "согласен на получение рассылок", "на обработку cookie..."

Ответить
Развернуть ветку
59 комментариев
Раскрывать всегда