Я использую WordPress и /sample-post/
URL-адреса для своих сообщений и /yyyy/mm/
для архивов.
Google полностью проиндексировал сайт.
Поскольку в архивах в настоящее время отображаются полные записи, я подумал, что не должен позволять Google индексировать страницы архива, поскольку они содержат полные записи, и это будет дублированный контент. Таким образом, мой robots.txt содержит:
Disallow: /2009/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /2014/
Disallow: /2015/
Как вы думаете, это хорошая практика или это повредит моим рейтингам и / или достижимости?
seo
wordpress
robots.txt
duplicate-content
google-index
cherouvim
источник
источник
Ответы:
Действительно, вам нужно избегать дублирования контента на вашем сайте Wordpress. Wordpress часто генерирует дублированный контент между категориями, архивами и тегами.
Чтобы решить эту проблему, вы можете заблокировать URL-адреса архивов в файле robots.txt, но лучше всего размещать их
<meta name="robots" content="noindex, follow">
на страницах архивов, чтобы избежать индексации этих URL-адресов Google.Для этого вы можете скачать плагин Wordpress SEO от Yoast . Когда плагин установлен, у вас есть возможность разместить эту мету где угодно (на страницах архивов, на страницах тегов, на страницах категорий ...). Вы можете перейти в меню плагина: SEO => Заголовки и метас .
На мой взгляд, лучшая практика для SEO - разместить эту мету на страницах архивов и тегов и позволить Google сканировать страницы категорий. Я всегда избегал дублирования контента на сайте Wordpress, как этот.
источник