Google разрешила владельцам сайтов отказываться от использования их данных для обучения ИИ Статьи редакции

До этого так же поступила OpenAI.

Компания представила инструмент Google-Extended. Его можно настроить через документ robots.txt, который сообщает веб-сканерам о том, к какой информации они могут получить доступ.
Издатели смогут скрыть свои ресурсы от роботов, которые собирают данные для обучения моделей Bard и VertexAI. При этом сайты продолжат индексироваться поиском Google.
По мере расширения технологий ИИ компания также намерена предлагать владельцам сайтов новые возможности по контролю за доступом к данным. О каких возможностях идёт речь — не уточняется.
В июле 2023 года Google обновила политику конфиденциальности, включив свои модели ИИ в список сервисов, которые могут обучаться на общедоступных данных из интернета.
В августе OpenAI разрешила владельцам сайтов блокировать доступ к данным для своего сканера GPTBot через robots.txt.

17K показов

2.9K открытий

62 комментария

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Вадим Д.

29.09.2023

А как заставить нейронки обучаться на свих сайтах? Куда заявление писать? В Госуслугах пока раздела нет.

Ответить

Развернуть ветку

Иван Дэвидсон

30.09.2023

Скоро будет. Повсюду будет ещё одна кнопка/галка о согласии использовать свои сведения для машинного обучения.

Это помимо "я согласен на обработку персональных данных", "согласен на получение рассылок", "на обработку cookie..."

Ответить

Развернуть ветку

Показать 62 комментария . Вы видите только часть дискуссии

Написать комментарий...

59 комментариев

Раскрывать всегда