Файл Sitemap помогает поисковым системам находить новые и обновленные URL - адреса на своем сайте. В частности, если ваш веб-сайт довольно большой, это может помочь им сосредоточиться на новом и обновленном контенте, вместо того, чтобы вслепую просматривать все, чтобы увидеть, изменилось ли что-нибудь. Это может привести к тому, что новый контент будет обнаружен гораздо быстрее, что может быть весьма заметно, особенно если сайт больше или сложнее.
В частности, с Google (я работаю в Google; я не знаю, как другие поисковые системы справляются с этим), он также делает следующее:
- Найдите количество проиндексированных URL-адресов для вашего веб-сайта: эта статистика пересчитывается ежедневно и очень точна. Вы можете найти их на странице сведений о файлах Sitemap .
- Обнаружение проблем канонизации. Если числа там не совпадают , это часто свидетельствует о том, что вы указываете URL-адреса в файле Sitemap, которые не совпадают с тем, что мы обнаруживаем во время сканирования. Обычно это признак того, что вам нужно работать над канонизацией .
- Помощь в канонизации. Когда мы найдем на вашем сайте несколько URL-адресов с одинаковым содержанием, мы дадим дополнительный URL-адрес, указанный в файле Sitemap, даже если вы не используете другие методы канонизации.
- Найти плохо проиндексированные части вашего сайта: эти показатели предоставляются для каждого файла Sitemap, поэтому вы можете создавать отдельные файлы Sitemap для логических разделов вашего сайта, чтобы обнаружить области, в которых Google не индексирует столько, сколько вам хотелось бы.
- Приоритизация ошибок сканирования: в разделе ошибок сканирования URL-адреса, указанные в файлах Sitemaps, перечислены отдельно. Поскольку вы специально указали эти URL-адреса, мы предполагаем, что вы хотите, чтобы они были проиндексированы и что любые ошибки при сканировании имеют важное значение.
Кроме того, вы можете использовать несколько расширений в файлах Sitemaps (например, для изображений, видео, новостей или интернационализации), если вы решите это сделать. Эти расширения являются необязательными.
Для большинства веб-сайтов наиболее заметным элементом файлов Sitemaps является то, что вы можете увидеть индексированное количество URL. Это может занять один день или около того, поэтому, если вы только что отправили файл Sitemap в первый раз, вам, возможно, придется проявить немного терпения. В то время как другие способы (например, site: -query) очень и очень приблизительны, этот подсчет чрезвычайно точен.
Отредактировано, чтобы добавить: еще одна вещь, которую я лично нахожу чрезвычайно полезной в отношении файлов Sitemap, заключается в том, что если вы не генерируете их напрямую с помощью CMS, вы неизменно узнаете много о том, как можно сканировать ваш веб-сайт и какие URL-адреса обнаруживаются. во время этого процесса. Я видел много случаев, когда при сканировании веб-сайта с помощью инструмента (например, генератора Sitemaps) возникают проблемы, которые вы могли бы пропустить в противном случае, будь то идентификаторы сеансов в URL-адресах, дублирование контента через различия URL-адресов, бесконечные пробелы (например, как бесконечные календари), или даже части сайта, которые вообще не связаны.
Если вы не получили никаких ошибок, вы можете предположить, что Google проанализировал его и знает о содержимом. Но это не значит, что они будут сканировать и / или индексировать эти страницы. Файлы Sitemap - это еще один способ рассказать поисковым системам о ваших страницах. Они не обязаны сканировать и индексировать любую или все эти страницы. То же самое относится и к поиску страниц по ссылкам или URL-адресам.
источник
Google обычно хорошо сканирует ваш сайт, если у вас достаточно качественных ссылок. Если вы тратите много времени на просмотр количества проиндексированных страниц, я бы посоветовал улучшить ваш сайт и получить несколько качественных ссылок.
источник
Может быть , это инструмент проверки карты сайта , как это , хотя я никогда «не» видел начало карта сайта пнуть в.
источник
Для более крупного сайта, например веб-сайта с сотнями, тысячами или миллионами страниц, это весьма полезно. У нас на сайте компании было 400 000 страниц, где URL-адреса создавались динамически по идентификатору контента, а параметры URL использовались вместе с &, Инструменты Google для веб-мастеров будут предоставлять вам отзывы о просканированных страницах и показывать ошибки, вы можете отлаживать или открывать страницу и убедитесь сами, что не так. Таким образом, Google фактически помог нам сделать лучший сайт и несколько раз избавил нас от огромного смущения.
Также полезно видеть количество проиндексированных страниц и количество просканированных.
Для небольших веб-сайтов, если веб-сайт представляет собой небольшую группу HTML-страниц, где каждая страница связана через меню, а сайт обновляется не часто, при загрузке карты сайта ничего не изменится в результатах поиска. Вы не будете иметь никакого преимущества в том, чтобы загружать карту сайта кому-то, кто не загружал карту сайта.
У меня также было около 20 небольших веб-сайтов, где у меня были автоматически генерируемые карты сайта с помощью скрипта cron, и я перестал это делать. Однажды я узнал, что файлы XML не генерируются правильно в течение 6 месяцев по моей ошибке, но, к счастью, Google проигнорировал мою ошибку и полностью проиндексировал эти сайты, даже когда в файлах Sitemap были ошибки, Google использует карту сайта просто как подсказку, куда идти, а не очень серьезно.
источник