Как Google обрабатывает хеш-фрагмент внутри канонического URL

13

Я видел много сайтов, использующих слагов в своих URL для повышения SEO, например:

http://example.com/article/1543/how-to-boost-seo/

Я думал, смогу ли я сделать что-то подобное вместо этого:

http://example.com/article/1543#how-to-boost-seo

и укажите его как канонический URL. В этой статье от Google говорится: «Это намек, который мы сильно уважаем». Включает ли это идентификатор фрагмента или он будет отброшен?

Вопрос переполнен
источник

Ответы:

13

Идентификаторы фрагментов традиционно используются для идентификации части документа для клиентских приложений. Как указано в спецификации Google принял:

Традиционно хеш-фрагменты (то есть все после # в URL) использовались для обозначения одной части статического HTML-документа. ... хеш-фрагменты не являются частью HTTP-запросов (и в результате они не отправляются на сервер)

Следовательно, поскольку это охватывает, робот Google по умолчанию игнорирует фрагменты хеша. Поэтому для этого URL:

http://example.com/article/1543#how-to-boost-seo

Googlebot нужно просто посмотреть на ресурс , возвращаемый сервером: http://example.com/article/1543игнорируя хэш - фрагмент: how-to-boost-seo.

Таким образом, ресурсом для вышеуказанного URL является канонический URL после нормализации (т.е. удаления фрагмента).

Цель использования пули - идентифицировать страницу как удобочитаемое ключевое слово. Использование фрагмента сбивает с толку эту цель и скрывает его читабельность:

/how-to-boost-seo намного более читабельно, чем: /1543#how-to-boost-seo

Короче говоря, использование фрагмента в качестве пули не будет полезным для пользователей или поисковых систем.

дан
источник
1
Спасибо за информацию. Я прочитал спецификацию, но формулировка просто не совсем понятна. Это все равно что пытаться определить, что Google будет индексировать на основе документа, предназначенного для сканирования AJAX. Читаемость можно улучшить, добавив /подобное /1543#/how-to-boost-seo.
Переполнение вопроса
Посмотрите последний раздел (номер 6) третьей ссылки в моем ответе здесь . Google игнорирует все после хэша, независимо от косой черты после него, потому что он должен нормализовать URL-адреса, чтобы предотвратить дублирование контента. Если вам нужно использовать хеш в URL, вам нужно будет использовать хэш, #!как описано в их спецификации.
Дэн
1
Я обнаружил, что это говорит о том, что Google делает индексные хэши, чтобы обеспечить переход ссылок в результатах поиска. Теперь, по крайней мере для меня, стало понятнее, что хеш-фрагмент нельзя использовать в основном результате.
Переполнение вопроса
Да, это для богатых фрагментов. Большинство поисковых систем одинаковы, в противном случае одна страница с множеством ссылок-якорей приведет к тому, что одна и та же страница будет проиндексирована несколько раз, что приведет к дублированию контента.
Дан