В Google Webmaster Tools я заметил, что моя первая страница была проиндексирована два раза:
example.com/
example.com/?chocaid=397
Я знаю, что мог бы исправить это с использованием типа ссылки canonical
, но мне интересно: откуда этот параметр?
Существуют различные сайты, на которых страницы индексируются именно с этим параметром / значением: https://duckduckgo.com/?q=chocaid%3D397 .
Я искал сходства между этими сайтами. но не смог найти убедительного: часто это первая полоса, но не в каждом случае. Некоторые NSFW, но не все. Когда URL-адрес одного домена имеет этот параметр, часто его имеют и другие дочерние домены того же домена.
Примеры
Википедия
Microsoft Codeplex
url
url-parameters
ОООНР
источник
источник
?chocaid=397
для индексации, вероятно, что-то ссылается на него, чтобы Google сначала нашел ссылку??chocaid=397
может быть попытка связать себя с хэшами (я не знаю много об этом, поэтому я не уверен в этом). Кроме того, это отличный вопрос.Ответы:
Насколько новый ваш домен? Вполне возможно, что это был популярный запрос на старом домене, и поэтому вы все еще получаете «посетителей». Это карта на действительной странице или 404? Если вы получаете там много хитов, а это 404, то я бы переназначил его (используйте .htaccess) на вашу домашнюю страницу или что-то в этом роде.
источник
canonical
, но этот вопрос больше касается происхождения этого параметра.Это может быть робот Google, пытающийся получить доступ к jQuery / Javascript и сканировать все, что может. Здесь недавно было сообщение о том, что кто-то просит помощи, потому что робот Googlebot сканирует недействительные URL на своем сайте. Джон М ответил, что робот Google может искать дополнительные URL-адреса для сканирования по сценариям на их сайте. Он работает в Google Webmaster Tools. Вы в значительной степени ответили на свой вопрос, установив канонический тег.
источник
Хотя у меня нет однозначного ответа, есть несколько вещей, которые я нашел, изучая это, которые могут помочь сузить его:
Мое лучшее предположение было бы, что есть / был некоторый сайт скребка, который добавляет этот URL ко всем ссылкам, которые он находит. Конечно, внешние ссылки кажутся наиболее вероятным объяснением того, откуда они берутся, а каталоги маловероятны из-за того, что они добавляются на совершенно случайные страницы.
источник
Это может быть от провайдера рекламы, который у вас может быть, у меня та же проблема, и единственно возможное место, откуда она исходит, от провайдера рекламы, внедряющего некоторые вредоносные программы через коды javascript.
источник