Google разрешила владельцам сайтов отказываться от использования их данных для обучения ИИ Статьи редакции

До этого так же поступила OpenAI.

  • Компания представила инструмент Google-Extended. Его можно настроить через документ robots.txt, который сообщает веб-сканерам о том, к какой информации они могут получить доступ.
  • Издатели смогут скрыть свои ресурсы от роботов, которые собирают данные для обучения моделей Bard и VertexAI. При этом сайты продолжат индексироваться поиском Google.
  • По мере расширения технологий ИИ компания также намерена предлагать владельцам сайтов новые возможности по контролю за доступом к данным. О каких возможностях идёт речь — не уточняется.
  • В июле 2023 года Google обновила политику конфиденциальности, включив свои модели ИИ в список сервисов, которые могут обучаться на общедоступных данных из интернета.
  • В августе OpenAI разрешила владельцам сайтов блокировать доступ к данным для своего сканера GPTBot через robots.txt.
0
62 комментария
Написать комментарий...
Крутой Физрук
Ответить
Развернуть ветку
Рубль Упалов

Быть умным это вовремя прикинуться тупым

Ответить
Развернуть ветку
2 комментария
Омар Кошмар
Ответить
Развернуть ветку
Hit WellNess

В духе "Страховщика" (2014) и "Иску́сственного ра́зума" (2001)

Ответить
Развернуть ветку
Хозяин

отличный маркер для роботов что как раз на скрываемых данных и надо обучаться

Ответить
Развернуть ветку
Вадим Д.

А как заставить нейронки обучаться на свих сайтах? Куда заявление писать? В Госуслугах пока раздела нет.

Ответить
Развернуть ветку
Аккаунт удален

Пока что нужно подать письменное заявление в МФЦ, берёте талончик и ждёте своей очереди. При себе важно иметь паспорт и СНИЛС

Ответить
Развернуть ветку
1 комментарий
Иван Дэвидсон

Скоро будет. Повсюду будет ещё одна кнопка/галка о согласии использовать свои сведения для машинного обучения.

Это помимо "я согласен на обработку персональных данных", "согласен на получение рассылок", "на обработку cookie..."

Ответить
Развернуть ветку
Чайка О.

Пока только приворот. Тут, на виси, мастер приворотов обитает.

Ответить
Развернуть ветку
Невероятный Блондин

Дорогой VC.ru!
Добавьте пожалуйста в robots.txt запись, что вы даёте 100% разрешение на обучение ИИ на комментариях и постах Невероятного Блондина.

Этот мир заслуживает стать лучше.

Ответить
Развернуть ветку
дед Мазай и санитары

Дорогой VC! Ни в коем случае не пускайте комментарии Блондина в ИИ, это будет катастрофа и Скайнет.

Ответить
Развернуть ветку
17 комментариев
Георгий

Стоит расставить точки над i, вы этими правилами не скрываете, а даёте знать, что именно хотите скрыть. Это тоже самое, что в веб-браузерах фича "Do Not Track", которую не стоит включать, т.к. этим вы уникализируете свой отпечаток браузера не более, а на сам ваш запрос разработчикам веб-сайтов до лампочки. Так и парсеры данных для ИИ будут плевать на ваш robots.txt, более того вы даже не узнаете что это парсер, у него user-agent будет естественно невинный. А Google не нужно парсить ваш вебсайт для ИИ, у них есть ваш кэш, который даже можно преобразовать с помощью ИИ, так что юридически не подкопаттся, что это именно ваши данные.

Ответить
Развернуть ветку
Дмитрий Зима

и как проверить обучался ИИ или нет?

Ответить
Развернуть ветку
Бомж

Задай вопрос ему чей Крым и ты узнаешь

Ответить
Развернуть ветку
8 комментариев
Roman Tabakov

полагаю,что проверить можно , но не нам обычным обывателям

Ответить
Развернуть ветку
Николай Борисов

Наконец появилось право выбора

Ответить
Развернуть ветку
Золотой крюк

не было выбора , это хорошее решение для ИИ

Ответить
Развернуть ветку
Аккаунт удален

Фича ради фичи, как и сквозное шифрование в разных сервисах

Ответить
Развернуть ветку
vinniy pogreb
новые возможности по контролю за доступом к данным

Пока ИИ не станет настолько умным, что обойдёт это

Ответить
Развернуть ветку
Аккаунт удален

ИИ лишь инструмент

Ответить
Развернуть ветку
Илья Заводов

А какую информацию собираются скрывать? Я понимаю, когда секретные данные, но зачем просто инфу прятать? Пусть ИИ учится

Ответить
Развернуть ветку
Ware Wow

чтобы траф сохранить на сайты, но конечно это помешает развитию ИИ

Ответить
Развернуть ветку
under construction

и чем это поможет?
будет + 1 итерация.

Ответить
Развернуть ветку
Дмитрий Перепродажный

• Интересная статья, спасибо.
• Но что об этом думают ридакторы в ридакции с точки зрения ритейла?

Ответить
Развернуть ветку
Рубль Упалов
Ответить
Развернуть ветку
Tony Joke

" разрешила владельцам сайтов отказываться от использования их данных для обучения ИИ"-ну хоть так , это обезопасит ИИ от неприятностей

Ответить
Развернуть ветку
дед Мазай и санитары

Надеюсь, Пикабу уже запретил. Иначе...

Ответить
Развернуть ветку
Xi

Яндекс сделает проще: не хочешь чтобы его нейросеть воровала твой контент? Ну значит запрети Яндексу индексировать твой сайт в принципе 😁

Ответить
Развернуть ветку
Водяной

Если бы не надвигающийся железный занавес, Яндекс ждала бы судьба майл ру

Ответить
Развернуть ветку
Melissa Mata

Правильное решение. В Интернете пишут все. Вне зависимости от уровня образования и психического здоровья.

Ответить
Развернуть ветку
PRO Interior Design PROID.st

Хорошая новость

Ответить
Развернуть ветку
Алексей Генералов

Идиотизм, а на кой тогда ИИ нужен без полных актуальных данных? давайте пойдем дальше и ограничим знания чат жпт школьной программой

Ответить
Развернуть ветку
Икрам Довлетханов

Интересно они это придумали. Все сайты нейросети уже просканировали, а теперь решили дать возможность владельцам сайтов отказываться от использования их данных для обучения ИИ.

Встаёт резонный вопрос, а что будет со старым данными, если владелец сайта воспользовался данным отказом? Его данные будут удалены, а ИИ-модель переучена или это касается только новых данных на сайте?

Ответить
Развернуть ветку
Илья Фролов

Но при этом никто же не читает пользовательские соглашения от гугла, может там как раз один из пунктов это сбор данных для ИИ

Ответить
Развернуть ветку
59 комментариев
Раскрывать всегда