Роскомнадзор рекомендовал хостинг-провайдерам ограничить сбор данных с сайтов ботами Google, OpenAI и другими — «Ъ» Статьи редакции

Чтобы исключить сбор информации об их критических уязвимостях, а также индексацию и анализ данных россиян.

  • Центр управления связью общего пользования Роскомнадзора в конце апреля 2024 года направил компаниям из реестра провайдеров хостинга письмо, которое содержит рекомендации по настройке ограничений доступа поисковых ботов к информации на российских сайтах. С документом ознакомился «Коммерсантъ».
  • По словам источника издания на рынке интернет-провайдеров, речь об иностранных ботах, в том числе — Googlebot от Google, GPTBot от OpenAI, Apple Bot от Apple и других. Такие роботы в автоматическом режиме посещают сайты для их индексации поисковиками, для интернет-рекламы или обучения нейросетей.
  • Ограничить доступ ботов нужно «для исключения сбора данных о критических уязвимостях российских ресурсов, индексировании данных россиян и анализа собранной информации», следует из письма. Провайдерам же «необходимо провести анализ рисков в своей зоне ответственности и при их обнаружении применить правила блокировки сбора сведений поисковыми ботами».
  • В письме приведён список идентификаторов, по которым можно отличить вредоносных роботов и сканеры уязвимостей. Получение документа подтвердили в DDoS-Guard и сообщили, что приняли его к сведению. В Роскомнадзоре на запрос издания не ответили.
  • Собеседник «Ъ» в крупной ИТ-компании отметил, что список приведённых в письме идентификаторов «очень большой, и их блокировка может повлиять на стабильность работы ИТ-систем».
0
138 комментариев
Написать комментарий...
Griby Lenina

То есть гугл будет плохо индексировать а чат жпт плохо генерировать на русском? Выглядит, как попытка остановить прогресс за счет налогоплательщиков.

Ответить
Развернуть ветку
Stepan Fedulin

Выглядит как проплаченная лобби яндексом чтобы остаться единственным говнопоисковиком в ру зоне - и как интересно они это делать будут... а если и что-то реализуют, не боятся ли они что многие сайты перенесут к другим хостинг провайдерам? ))))))

Ответить
Развернуть ветку
6 комментариев
Чайка О.

Да кому нужен этот прогресс? На виси статейки клепать, да на ГС контент?

Ответить
Развернуть ветку
1 комментарий
Буквоед

«Чтобы исключить... анализ данных россиян»
Нидайбох Илон Маск узнает ФИО жителя Сыктывкара Петра Сергеевича Дерябкина!

Ответить
Развернуть ветку
Невероятный Блондин

Любопытный выбор имени.

Ответить
Развернуть ветку
Куртуазный маньерист

скорее речь про сбор данных, что бы оценить происходящее в РФ. Вероятно эти данные используются для принятия решений политиками.

Ответить
Развернуть ветку
12 комментариев
Kiss1nger

И завербует его для службы Байдену и рептилоидам !

Ответить
Развернуть ветку
5 комментариев
Labeling

100% найдутся индивиды, которые в этот бред поверят, и будут с пеной у рта доказывать как поисковые боты собирают информацию об уязвимостях на сайтах.
И даже тот факт, что автоматические сканеры, которые регулярно долбятся в попытках заэксплуатировать одну из уязвимостей, не будут использовать заблокированные идентификаторы, ни разу для них не аргументь - Гугл, АНБ следят, смотрят, изыскивают как бы взломать сайт Васи Пупкина, в то время как главный защитник всея Руси борется в сетряными мельницами и блокирует 127.0.0.1.

Ответить
Развернуть ветку
Веселый стробоскоп

Уже нашлись, два коммента выше 😂

Ответить
Развернуть ветку
Слегка Придурковатый

Рекомендации по настройке ограничений доступа поисковых ботов, поди, выглядели так:

User-agent: Yandex
Disallow:

User-agent: *
Disallow: /

Ответить
Развернуть ветку
makol

Нет на стороне сервера закроют и начнут вероятно с веб хостингов где пасутся на одном серваке по 500 - 1000 сайтов, там не дают доступа к конфигам сервера, там что то могут реализовать, но крупные проекты которые на VPS и VDS с этим сложнее - клиент нахер может такой хостинг послать и уйти к другим.

Мне интересно а РКН о последствиях думает?

Ответить
Развернуть ветку
1 комментарий
Микс из мусоровоза

Учитывая, что отдаваемые данные в ботах не пишут что это именно чатджп, в что то типа chrome gecko 5.0 html os win 7

Ответить
Развернуть ветку
1 комментарий
Владимир Егоров

Вот только поисковые роботы Гугла команды в robotx.txt воспринимают как пираты Карибского моря кодекс: "это лишь свод указаний, а не жёстких законов. Смекаешь?". Поэтому придётся поднапрячься и прописать в каждой странице в head .<meta name=”robots” content=”noindex, nofollow”/>.

Ответить
Развернуть ветку
4 комментария
sunblade

На днях подавал декларацию 3-ндфл на сайте налоговой и понял, что эти дебилы даже сбор налогов не могут нормально организовать, глючит абсолютно все! Выручили на каком-то форуме, предложили воспользоваться старой версией сайта. А вы тут блокировку ботов обсуждаете .... :)

Ответить
Развернуть ветку
selecadm

с Почтой России то же самое. Формирование трек-номера тупо не нажимается последняя кнопка, ничего не происходит. И даже удалили ссылку на старую версию. Беру из истории браузера и всё работает. Ну тупые!

Ответить
Развернуть ветку
Stepan Fedulin

То что все работает через жопу их не остановит - там в головах одна извилина и та прямая до сортира - а яше выгодно лоббировать эту хрень они пол триллиона за выкуп своих активов у запада вывалили, а с кого доить потерялись, повысят цены на директ многие отказаться могут.

Вот и лютуют, создателей то нет уже рядом а те гении которые управляют только о бабле думают им в казну откаты платить надо.

Ответить
Развернуть ветку
1 комментарий
Ла Ма

В налоговой оборудование, древнее как мамонт. Мама раз в день на час-два в определенное время в региональную базу заходила, потому что потом все не работало. 😬 А так только местными данными своей налоговой пользовалась.

Ответить
Развернуть ветку
Вадим Д.

Палкой по хребту этих ботов! Удумали они.

Хорошо что Центр управления связью бдит и заботится о россиянах.

Ответить
Развернуть ветку
Чайка О.

Только палку ломать об железо. Есть простой проверенный способ — отключение.

Ответить
Развернуть ветку
2 комментария
Денис Мартынов

вот это забота, вот это молодцы,так держать

Ответить
Развернуть ветку
ildarin

Это случаем не та организация, которой мы платим, чтобы они занимались цензурой, ограничением информации и ломали интернет?

Ответить
Развернуть ветку
Станислав

По мне хорошее решение. Админы сайтов думаю знают, что в день может десяток таких ботов зайти на сайт и начать скачивать данные. Раньше приходилось бороться самому с ними. Теперь это геморой хостера будет.

Гугл можно оставить. А остальные все пол нож. И российские тоже.

Ответить
Развернуть ветку
Невероятный Блондин

А ведь ты это всё на полном серьезе из своей головы вытащил.

Некоторые головы конечно очень занятные.

Ответить
Развернуть ветку
lucklessman

А какой толк от сайта, который не индексируется?

Ответить
Развернуть ветку
6 комментариев
Jiu and vali
начать скачивать данные.

Какие данные? Вот про какие данные ты пишешь? Твои портянки текста? Из по щелку пальца у тебя заберет любой вебмастер. И никакая защита не поможет.

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
Разработка Телеграм-ботов

Ты врешь. Нет в ЕС, Канаде, Австралии и Пендосии запретов на индексацию сайтов ботами других стран.

Ответить
Развернуть ветку
22 комментария
Elnar I

Они ничего не запрещают и не блокируют, просто конторам нужно написать небольшой манифест об использовании данных, как они хранятся и кому передаются.

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
2 комментария
I S

У вас такие потрясающие комментарии с 18 апреля, даты вашей регистрации)))

Ответить
Развернуть ветку
Император Нолимоций

Быстро же вас всех на нейронки заменили. Прогресс.

Ответить
Развернуть ветку
Водяной

Да пошел этот. Ркн .... Уже за***ли

Ответить
Развернуть ветку
Alexey Ivanov
Да пошел этот. Ркн

Нет, не пошел. Как миленькие будете выполнять. А то что зубами скрипите, да на кухнях друг другу жалуетесь... Ну так и кошка орать-то орёт, а коту свое дело делать не мешает

Ответить
Развернуть ветку
11 комментариев
Григорий Лепсин

Тоже думаю что решение хорошее. Теперь все данные под защитой будут. Ну и самое главное это головная боль провайдера теперь.

Ответить
Развернуть ветку
Анар FS

"Теперь все данные под защитой будут" - подавился чаем без заварки

Ответить
Развернуть ветку
1 комментарий
Dark Soul

Ты из роскомпозора? Начальство бросило жопой амбразуры закрывать?

Ответить
Развернуть ветку
1 комментарий
Jiu and vali

Под какой защитой?

Ответить
Развернуть ветку
Jiu and vali

Всем похуй на твои данные, они давно уже в сети. Это закручивание гаек, и чтобы ты перешел на яндекс.

Ответить
Развернуть ветку
Владимир Степанов

естественно эту рекомендацию будут соблюдать все хостинг провайдеры

Ответить
Развернуть ветку
Alexey Ivanov

Естественно. Или не будут работать на российском рынке. После этого условные МТСы и Ростелекомы скажут большое спасибо за окончательную зачистку поляны :)

Ответить
Развернуть ветку
Serge Chigirin

РКН пробил очередное дно. Клоуны

Ответить
Развернуть ветку
Юрий Б.

То есть это все рекомендации? Можно выполнять, а можно не выполнять?

Ответить
Развернуть ветку
Невероятный Блондин

Нет, в России это носит обязательный характер. Также как и с «нежелательными» организациями.

Ответить
Развернуть ветку
Алексей Леденев

А можно уже я сам буду решать кому и какие данные свои отдавать?

Ответить
Развернуть ветку
Станислав Пржембольский

Нет

Ответить
Развернуть ветку
Иван Дэвидсон

Немного опоздатушки. 80% трафика - это штук 50 популярных сервисов

Ответить
Развернуть ветку
Станислав

В США на жпт в суд подают, за нарушение авторских прав. У нас либералы предлагают его бота хлебом с солью встречать.

Вы допустим разместили на своем сайте статью, в надежде что к вам будут приходить люди за информацией. А они просто идут в чаты ИИ.

Ответить
Развернуть ветку
Аккаунт заморожен

Комментарий недоступен

Ответить
Развернуть ветку
3 комментария
High Stakes

Хтонические куплеты.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Эльвира Богуславенко

Поиск гугл итак уже не тот, что раньше

Ответить
Развернуть ветку
Jiu and vali

Он стал лучше, без рекламы и цензуры. А яндекс с кучей дыр.

Ответить
Развернуть ветку
Frolov Konstantin

То ли дело выдача Яндекса: Скам и вирусня

Ответить
Развернуть ветку
xbevice

Огонь. Это если всякие чатгпт не смогут парсить пикабу, то в рунете яндекс станет лучшим вообще ничего не делая. Отличная идея!

Ответить
Развернуть ветку
Александр Толстенко

Да блокирнули бы уже гугл да и все)

Ответить
Развернуть ветку
Jiu and vali

Да, твой хлеб блокнут, и все. Пойдешь на завод гайки точить, а не сайты делатью.

Ответить
Развернуть ветку
1 комментарий
МосЮрист.ком

Какая глупая рекомендация)
ЕГЭ проникло в структуру?)

Ответить
Развернуть ветку
Дмитрий Матюшин

Ага, вот взяли и перестали анализировать данные, каждая платформа этим занимается и что теперь?

Ответить
Развернуть ветку
Bad Gateway

Праильно. Только наши могут данные о своих собирать

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
135 комментариев
Раскрывать всегда