Оффтоп Andrey Frolov
8 887

Google: В попадании файлов из Docs в «Яндекс» и другие поисковики не было сбоя

Google высказала свою позицию по поводу документов из сервиса Google Docs, которые попали в выдачу «Яндекса» и других поисковиков. В компании сообщили, что сервис работает корректно.

Поисковые системы могут индексировать только те документы, которые намеренно были сделаны их владельцами публичными, или когда кто-либо публикует ссылку на документ, владелец которого сделал его доступным для поиска и просмотра всем в интернете.

Вы всегда можете изменить настройки доступа к вашим файлам и установить ограничения: что именно доступно для просмотра, комментирования или редактирования выбранным пользователям.

пресс-служба Google

Вечером 4 июля пользователи «Яндекса» обнаружили, что поисковик и другие сервисы индексируют документы из Google Docs — в том числе те, у которых был включён «доступ по ссылке». В ночь на 5 июля сотрудники «Яндекса» изъяли эти ссылки из выдачи и сообщили в Google о ситуации.

#новость

{ "author_name": "Andrey Frolov", "author_type": "editor", "tags": ["\u043d\u043e\u0432\u043e\u0441\u0442\u044c","\u043d\u043e\u0432\u043e\u0441\u0442\u0438"], "comments": 44, "likes": 27, "favorites": 1, "is_advertisement": false, "subsite_label": "flood", "id": 41456, "is_wide": true, "is_ugc": false, "date": "Thu, 05 Jul 2018 17:58:00 +0300" }
{ "id": 41456, "author_id": 14066, "diff_limit": 1000, "urls": {"diff":"\/comments\/41456\/get","add":"\/comments\/41456\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/41456"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199791 }

44 комментария 44 комм.

Популярные

По порядку

Написать комментарий...
35

Не баг, а фича

Ответить
4

Вконтакте что-то никого и не тревожит с их документами.

Ответить
–2

Вероятно, что там их никто не хранит!?

Ответить
6

А что, для кого-то это не было очевидно?
Доступ к документу открыт для всех, вполне логично что его могут увидеть поисковики.

Ответить
21

Проблема была в том, что документы, которые были доступны только по ссылке, и эта ссылка нигде в открытом доступе не размешалась, а только пересылалась через мессенджеры и открывалась в браузере получателя, оказалась в индексе поисковых систем,

Ответить
8

Это не противоречит никаким логическим аспектам или заявленному поведению поисковых сетей. Соответственно, это не баг. Если бы на сайте google docs были созданы нужные манифесты robots.txt, но ПС их проигнорировала, можно было бы лить претензии.

Более того, все ресурсы, с какими бы то ни было уникальными адресами, посещаются в автоматическом режиме вашим провайдером после вас, пауками работающими в связке с браузером и еще бог знает кем.

Даже при расшаривании ссылки в мессенджере, мессенджер делает превьюшку для ссылки, а значит что по ней ходит какой-то паук.

Это все пример классического Security through obscurity (Безопасность через неясность), и он уже давно не термин для гиков https://ru.wikipedia.org/wiki/%D0%91%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D1%87%D0%B5%D1%80%D0%B5%D0%B7_%D0%BD%D0%B5%D1%8F%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C

Юзерам давно пора привыкнуть -- размещаешь фоточки в социалке в открытом альбоме, не удивляйся что они попали куда-то. Хотя я и понимаю, что рядовой юзер об этом не думает.

Ответить
1

Никакого отношения к Security through obscurity это не имеет.

Security through obscurity это если бы была веб страница, а внизу незаметная глазу буква "П", на которую нужно было щёлкнуть, чтобы перейти в секретный раздел. Возможно "щёлкалась" бы она каким-то жёстко обфусцированным javascript.Прямо как в фильме "Сеть". И если бы ставка была бы не на то что её не найдут поисковики, а на то что просто никто не догадается её щёлкнуть или что-то искать в поисковиках.

Здесь же полноценный секретный идентификатор, ничем не отличающийся от shared secret или стойкого пароля.

Проблема только в том что в современном веб сложилась традиция не считать URL чем-то секретным, и соответственно, секретные токены в URL передавать нельзя.

Ответить
1

Нет, и то и другое входит в STO. Неясность логики генерации уникального URL => Security through obscurity

Ответить
1

Саня ты олень, потому-что твоя логика никуда не годится.
Если ссылка на док не засвечена в том месте, где ходят поисковые роботы, на форуме или здесь в камментах например... То каким йухЪом она индексируется поисковиком?
Это вообще ни разу не фича.

(Может где-то на 9833 странице "лицензионного соглашения" и написано мелким шрифтом, что расшаренный док автоматом попадёт в индекс других поисковиков, даже если вы никому эту ссылку ни разу не кидали. По факту это тупо кидалово юзера, неприятный нежданчик)

В общем твоя идиотская логика отвратительно смотрится на фоне типа интеллектуальных камментов.
Поэтому от агрументированной дискуссии сразу перейдём к оскорблениям -- ты олень.

Ответить
1

На твои оскорбления я ответить могу, но не буду. Замечательно, что ты ради этого даже сделал фейковый аккаунт в фейсбуке.

По сабжу: а поисковики где-то обещают, что в поиске будут только те страницы, которые "были засвечены где-то коментах"? Все, что не закрыто под приватный доступ, может попасть куда угодно, включая поисковики. Есть один инструмент, где можно указать, что ты не хотел бы чтобы попало в поиск, это robots.txt. Это официально предоставленное средство поисковиками.

Нужно голову включать, а не вот это вот нытьё, которое тут некоторые льют в коментах.

Ответить
0

То есть для вас ок, что поисковые машины индексируют личную переписку?

Ответить
0

Если эта переписка хранится на сайте в открытом виде, то да. Все претензии к тому месту, где вы переписываетесь, а не к поисковикам.

Ответить
0

Переписку, которая идет через gmail и пр почтовые сервисы. А не "хранится на сайте в открытом виде". К поисковикам никаких претензий, само собой. Но со стороны Google Drive не закрывать индексацию контента по ссылке, которая отправляется в письме и больше нигде, этовсе равно что если бы Google стал давать в выдаче содержимое наших писем.

Ответить
0

Если бы в Gmail была кнопка "Открыть доступ по ссылке" с подписью "Просматривать могут все, у кого есть ссылка", было бы то же самое. А так не то же самое.

Ответить
2

Нет, не так. Расшарить файл в драйве гугл предлагает тремя вариантами, один из которых называется "публичный доступ", второй - "доступ только по ссылке" и третий "личный доступ". И что тут намекает на то, что при втором варианте содержимое файла будет индексироваться как и при первом, хотя обещано, что доступ только у тех, кто получил ссылку, причем только в письме?

Ответить
0

Ради вас зашел и проверил

Ответить
1

И? Почему часть письма (ссылка в этом случае, или текст, или картинка в других случаях) индексируется поисковиками?

Ответить
0

Потому что могут :))

Ответить
3

Яндекс проиндексировал документы, которые открывались в яндекс.браузере. Правда или ложь?

Ответить
5

Похоже, что индексирует.
Но какое это имеет значение?
Гугл сам читал пользовательскую почту и мог догадаться, что ситуация индексации при пересылке возможна.

Сейчас мы имеем окно с описанием доступности документа.

Доступно для ПОИСКА и просмотра всем пользователям интернета.

Доступно для просмотра тем у кого есть прямая ссылка.

Доступно только вам.

В двух последних случаях, про поиск нет ни слова.

Но да. Технически страница отдается. Отдается с текстовым массивом. И может быть проидексирована.

Поэтому технически это не баг, а фича.

Для того, чтоб избежать такой некрасивой ситуации, Гуглу всего то надо было по ссылке отдавать какой-нибудь дисклеймер типа "на этой странице размещен контент, в котором может быть что угодно. Показать".

И по клику уже подгружать контент.

Но признать, что они обосрались - хрен. До последнего будут отпираться. А потом "мы ввели новую фичу для сохранности ваших документов".

Ответить
0

Конечно, индексирует :). Яндекс делает то, что начал когда-то делать Google.

Ответить
0

Не спасёт. Поисковые роботы умеют нажимать кнопки.

Накосячить гугл мог только в одном - если он не закрыл ссылки от индексирования. Но это никак не раскрывает того, как яндексовые роботы получили эти ссылки, которых нигде не было в доступном им интернете. Если и обосрались, то сразу обе компании.

Ответить
0

Робот умеет ходить по ссылкам.
Наверное он даже умеет нажимать кнопки, которые размечены как кнопки, например, у них стоит role="button".
А индексировать ajax роботы не умеют. Эта проблема до сих пор решается костылями разной степени изящности. Так в чем проблема, просто не решать эту проблему (прошу прощения за скудность речи).

А вот то, что сервисы ходят по ссылкам гугл знал.
Мессенджеры ходят при отправке.
Паук из почты может ходить при получении.
Браузер может ходить при открытии.
Так что к Гуглу вопрос по безопасности и по формулировкам уровней доступности вводящим в заблуждение.

К Яндексу моральный вопрос.
С одной стороны, индексация через браузер, наверное ускоряет индексацию. С другой - вот такая вот фигня.
Хз, насколько можно считать косяком излишнее рвение по ускорению и расширению индексации.

Ответить
0

Иногда роботы не умеют нажимать кнопки.

Пример - человеку показывается "Ты ж погодь...", роботу "Жми"

Робот - жмет

Ответить
0

Это как? Технически, что это за разделение, как оно осуществляется, на основании чего и с какой целью.

Вообще я не задумывался никогда. Жмут ли пауки на кнопки, не являющиеся ссылками. Пока тоже не вижу, какой в этом смысл. Не могу представить сценарий. Надо будет сегодня изучить этот вопрос.

Ответить
1

на самом деле очень просто.

Это всего лишь современный фреймворк с подпиской на какую то базу. Подписка занимает полсекунды. Человек полсекунды просто не успевает оценить, а робот успевает увидеть кнопку

Не то чтобы в этом был смысл, это просто как оно работает

Ответить
0

Я просто плохо представляю, как работают, например, спамботы. Но очень сомневаюсь, что они жмут на все кнопки подряд.
Например, после нажатия сабмита "подписаться" может вылезти окно с уведомлением о использовании ПД и двумя кнопками: эгри-дизэгри.

Так-то да. Можно какой-либо элемент делать просто невидимым. Но нет гарантии, что и бот на него ткнет.

И мы же всё-таки говорим о поисковиках. Принципиальная разница в том, что в случае со спамботом бот пишется подстроенным под конкретную задачу или под наиболее распространенные сценарии. А в случае с поисковиком, всё-таки сценарии подгоняются под заявленный функционал готовых алгоритмов индексирования.

Ответить
0

Тут фишка в том, что это по разному воспринимается ботом и человеком.

А так все можно имитировать. Но нужно потратить некоторые усилия. И пока 80% сайтов это WP, то никто ничего делать не станет

Ответить
0

Я понимаю, что это фича, но есть нюанс, была ли ссылка на документ в публичном доступе.

Ответить
4

Почитайте это и сделайте выводы:
https://habr.com/post/262695/
https://habr.com/post/142883/

А вот цитата официального представителя Яндекс-браузера:

Яндекс.Браузер собирает обезличенную статистическую информацию для улучшения качества Браузера, в которую включаются в том числе и адреса посещённых страниц. Это происходит только в том случае, если человек разрешил делать это в настройках программы (проставил галочку «Отправлять в Яндекс статистику использования»).

Ответить
3

проставил галочку «Отправлять в Яндекс статистику использования»

Галочка по-умолчанию включена или выключена?

Ответить
0

Здравствуйте, я параноик, я отключаю эти галочки..

Ответить
1

Да, и все они по совпадению были с доступом по ссылке

Ответить
0

Мы этого не узнаем

Ответить
1

Продвижение Гугл-документов. В очередь, пожалуйста.
https://docs.google.com/document/d/1fCJ7EQAeQn0eybqYSwGejjdA0tIIJzv1D7nZpMtPsN0/edit?usp=sharing

Ответить
0

Накрылся документ в мобилке

Ответить
0

Что там было?

Ответить
0

Там до сих пор такой пиздец)) пацаны с десигна подтянулись

Ответить
0

У гугла давно документы в поиске есть

Ответить
0

Вконтакте можно сделать поиск по документам и смотреть чужие файлы, и это тоже нормально.

Ответить
0

Это как говорится, есть такая фича, но мы забыли о ней сказать. Крутая фича.

Ответить
0

Истина стара, как мир: "Вы можете считать вашими данными только те, которые физически хранятся у вас, и к которым вы физически имеете доступ" (отсюда: https://vc.ru/27896-pusto-kak-navesti-poryadok-v-faylah-chtoby-ne-prevrashchat-desktop-v-chulan#comment-541765)

Ответить
0

Каждый, кто ставит доступ по ссылке должен знать, что это ничем не отличается от публичного доступа. Ссылка через уже несколько секунд может быть у кого угодно вообще. Не имеет значения, на сколько параноики лично вы и настройки ваших браузеров (верить, что настройки работают, что багов в применении настроек на бывает, лол), если эти ссылки отдаются собеседнику. Дополнительно отмечу, что отдаются они обычно через заведомо скомпроментированные каналы связи — бесплатную почту, мессенджер.
Если нужно шарить данные, то только с доступом по приглашению. Да и то такой подход всего лишь уберёт опасность, что Васян сможет увидеть документ. А вот вредоносное расширение вашего браузера документ всё равно увидит целиком. Но обычно это приемлемый риск.
Если документ действительно важен, то только глупцы передают его не в контейнере, пароль от которого передаётся по совершенно другому каналу связи.

Это же базовые знания для Интернета.

Ответить
0
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Команда калифорнийского проекта
оказалась нейронной сетью
Подписаться на push-уведомления
{ "page_type": "default" }