{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Легко и быстро создаем правильный файл - ROBOTS.TXT

Файл robots.txt - это текстовый документ, разработанный для обмена информацией между веб-пауками (поисковыми системами, роботами и аналогичными сущностями) и вашим веб-сайтом. В этой текстовой конфигурации содержатся инструкции для веб-пауков, определяющие, какие страницы подлежат индексации, а какие должны быть исключены из процесса обхода.

Давайте рассмотрим пример простого файла robots.txt:

User-agent: * Disallow: /Здесь перечислено содержимое, которое не должно быть проиндексировано различными поисковыми системами.

User-agent: Yandex Disallow: /В этой части указывается информация, которую поисковый робот Yandex не должен видеть.

Host: вашсайт.ru / Укажите свой домен здесь.

Sitemap: https:// Вставьте ссылку на вашу карту сайта.

Как составить правильную карту сайта - читайте!

Инструкции по интеграции карты сайта в файл robots.txt следующие: Просто добавьте строку, указывающую на местоположение вашей карты сайта, в файл robots.txt.

Давайте разберем файл на части:

User-agent: * указывает на то, что последующие указания применяются ко всем веб-паукам.

Disallow: /личное/ означает, что содержимое папки /личное/ не должно попадать в поисковый индекс.

Disallow: /администратор/ запрещает индексацию содержимого папки /администратор/.

Disallow: /секретная-страница.html объявляет, что определенная страница секретная-страница.html не должна индексироваться.

При настройке файла robots.txt важно адаптировать его к особенностям вашего сайта. Запомните, что это лишь рекомендация, и некоторые веб-пауки могут игнорировать ее.

Не забудьте разместить файл robots.txt в корневой директории вашего сайта и обеспечить доступ по адресу http://www.example.com/robots.txt, где www.example.com - ваш домен.

Мой пример:

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Disallow: */attachment/*
Disallow: /page
Disallow: */page/
Disallow: /poisk
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Disallow: */attachment/*
Disallow: /page
Disallow: */page/
Host: https://твой_сайт.ru
Sitemap: https://твой_сайт/карта_сайта.xml

0
Комментарии
-3 комментариев
Раскрывать всегда