Я использую Drupal 7 и пытаюсь использовать метатег noindex для предотвращения индексации http://example.com/comment/reply/43/738 поисковыми системами.
Страница комментариев / ответов индексируется, хотя я использовал следующую роль в файле robots.txt:
Disallow: /comment/reply/
В какой файл шаблона мне нужно будет включить метатег noindex для / comment / reply / pages?
robots.txt
файле?Ответы:
Вы можете использовать любой из этого кода в robots.txt:
Это будет игнорировать каждый URL, который содержит комментарий .
Вы также можете использовать следующее, чтобы пренебрегать каждым URL, содержащим / комментарий .
После этого проверьте, работает ли он или нет, с помощью средства проверки Google Robots.txt .
источник
В template.php вашей темы или в page.tpl.php вы можете проверить URL страницы, чтобы увидеть, является ли страница страницей комментариев, а затем добавить код, который будет вставлять метатег.
Вы можете сделать это в функции template.php YOURTHEME_preprocess_html () или вставить ее где-нибудь в верхней части page.tpl.php. Код для добавления будет выглядеть примерно так:
Смотрите drupal_add_html_head () .
источник
Обновление : работает следующее, печатает
<meta name="robots" content="noindex,follow" />
в разделе заголовка все страницы, к которым осуществляется доступ, начиная с путиcomment
. Это нужно для того, чтобы обойти тот факт, что страница, подобная comment / 3, внутренне несет в качестве аргументов node / nid, как указывалось выше в jmarkel.С помощью полезного комментария к функции arg .
Надеемся, что в конечном итоге это будет решено модулем мета-тегов - есть запрос на добавление функции , но пока не ясно, хочет ли автор модуля поддержать это.
[Мой предыдущий комментарий] Я просто хотел добавить, что использование robots.txt не является ответом - как вы уже заметили, ссылки продолжают появляться в результатах поиска, несмотря на использование
Disallow: /comment
. Это ожидаемо, поскольку robots.txt говорит боту не сканировать эти страницы, но не говорит Google не индексировать его. Как объяснено в SEOmoz Robots.txt и Meta Robots Best Practices для поисковой оптимизации :источник