Как предотвратить отображение файлов моего XML-файла в результатах поиска Google, например, в результате site:
поискового запроса:
Я не понимаю, почему Google решил показывать файлы карты сайта в результатах поиска для начала. Эти файлы не предназначены для потребления человеком.
Google должен иметь возможность сканировать его, чтобы иметь возможность обрабатывать его, поэтому я не могу запретить его в robots.txt . Я просто не хочу, чтобы они помещали его в результаты поиска после его обработки.
google
sitemap
search-engine-indexing
googlebot
xml-sitemap
Стивен Остермиллер
источник
источник
/sitemap.xml
перечислил в robots.txt, а затем ссылки на другой набор других файлов, таких как/sitemap-123.xml
и/sitemap-124.xml
. Я регенерирую карты сайта каждый день, а числа меняются ежедневно. Тот, который проиндексирован, довольно старый. Я нигде не ссылаюсь на него на моем сайте, но возможно, что на каком-то другом сайте есть ссылка на него где-то./sitemap.xml
меня, чтобы предположить, что этот конкретный файл сайта теперь выпадет из индекса. Я бы хотел запретить Google показывать их пользователям для поиска в будущем.Ответы:
Google индексирует карты сайта XML (как и любой файл XML). Если Google знает URL-адрес и возвращает правильный ответ, тогда он пройдет правила включения Google и может быть проиндексирован. Лично я отправляю карту сайта только через GWT и включаю
Sitemap:
ссылку в robots.txt, и этого, безусловно, достаточно для индексации.Рекомендуемый метод предотвращения индексации этих файлов Google - включить
X-Robots-Tag
заголовок ответа HTTP при обслуживании карты сайта XML. Например:Так же, как и включение метатега robots в файлы HTML,
X-Robots-Tag
заголовок может использоваться для любого типа файла.Ссылка: этот документ (с ноября 2008 года!), По-видимому, цитирует нашего собственного Джона Мюллера (Google) относительно использования
X-Robots-Tag
ответа при работе с картами сайта XML.Да, Google будет индексировать и ранжировать ваш файл XML Sitemap
Для получения дополнительной информации см. Руководство Google для разработчиков:
метатег Robots и спецификации заголовка X-Robots-Tag HTTP.
источник
X-Robots-Tag: noindex
код заголовка? Внутриsitemap.xml
илиrobots.txt
?header('X-Robots-Tag: noindex',true)
) или, если вы используете Apache, то в своем файле .htaccess или конфигурации сервера. Смотрите ответ Стивена для примера кода. Также см. Руководство разработчика Google по ссылке выше.Ответ MrWhite об использовании X-Robots-Tag является правильным способом сделать это.
Вот код, который можно использовать в файлах конфигурации .htaccess или Apache для этого. (Ссылка: WebmasterWorld - файлы Sitemap отображаются в поисковой выдаче - как это предотвратить? )
Под nginx конфигурация будет выглядеть следующим образом. (Ссылка: примеры Yoast X-Robots-Tag )
источник
Почему это имеет значение?
Если вы действительно можете найти свою карту сайта в поисковой выдаче, то у вас большие проблемы.
Я бы сфокусировался на том, чтобы получать страницы с полезным контентом. Таким образом, вам будет очень трудно даже найти вашу карту сайта. Не то чтобы тебя это все равно волновало.
PS
Практически каждый хранит карты сайта в одном и том же месте. Так что, если кто-то захочет найти, где вы его храните, он найдет :)
источник
поместите в robots.txt следующее
вместо этого отправьте свою карту сайта с помощью инструментов Google для веб-мастеров.
источник