В поисковую выдачу «Яндекса» попали документы Google Docs

Поисковая система «Яндекс» проиндексировала документы Google Docs, находящиеся в публичном доступе.

В поисковую выдачу «Яндекса» попали документы Google Docs

Обновлено 5 июля: Часть неприватных документов в Google Docs была проиндексирована и другими поисковыми системами. Сотрудники «Яндекса» изъяли эти ссылки из выдачи и обратились в Google с предложением обратить внимание на ситуацию.

4040
102 комментария

Яндекс индексирует всю открытую часть интернета — те страницы, которые доступны при переходе по ссылкам без ввода логина и пароля. Страницы, индексация которых запрещена администратором сайта в файле robots.txt, Яндекс не индексирует, даже если они находятся в открытой части интернета.

В среду вечером в службу поддержки обратились пользователи с жалобами на проблему доступности файлов на docs.google.com. Наша служба безопасности связывается сейчас с коллегами из Google, чтобы обратить их внимание на то, что в этих файлах может оказаться приватная информация.

39

Проиндексированы документы, на которых нет ссылок! Каким образом они попали в базу Яндекса? Не через Яндекс браузер случайно? robots.txt тут вообще не причём. Какие ещё документы и данные, на которых нет ссылок, могут оказаться в базе Яндекса ?

9

А такой вопрос — Яндекс браузер каким то образом собирает данные для большого поисковика Яндекса?

3

robots.txt - это запрет сканирования, а не индексации. Запрет индексации это noindex/X-Robots-Tag. Наоборот нельзя запрещать сканирование в robots.txt.

3

Надо признать у других поисковиков давно так

2

А еще вы добавляете в индекс непубличные адреса, которые пользователь открывает в вашем браузере.

1

Нормаль так гуглу поднасрали, жаль, что обычных людей задели