Сегодня я искал в своем инструменте Google Webmaster для своего сайта и вижу дубликаты названий для следующих страниц на моем сайте (небольшая выборка из многих в моем индексе сайта):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
Это, конечно, не страницы, которые я создал!
Я также посмотрел на свои структурированные данные, которые я создал на своем сайте, и я вижу это (небольшой пример из многих):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Ничто из этого не является результатом того, что я сделал. Это, очевидно, какое-то горе или сложный план, чтобы украсть страничку.
Вчера я установил на всех своих страницах php автоматизированные перенаправления и канонические ссылки 301, чтобы попытаться это исправить (благодаря некоторой замечательной помощи от людей, переполняющих стек). Но я хотел бы больше узнать об этом и какова их цель.
Ответы:
Некоторые пути, по которым несуществующие страницы попадают в индекс Google
Существует 3 способа, которыми несуществующие страницы могут оказаться в Google или любой другой поисковой системе по этому вопросу, а именно:
Ваши страницы ссылаются на эти страницы. (Это может быть карта сайта, страница профиля, комментарий в блоге или ссылка на основе ссылки href ...) Я видел, например, некоторые плагины из WordPress, которые содержат такие ссылки, потому что они были разработаны на одном сайте и затем загружены в библиотека плагинов, но у разработчика есть настройка кеша, с которой столкнулся плагин.
Обратная ссылка указывает на эти страницы.
Я видел страницы индекса Google и строки, которые просто не существуют, хотя у вас, кажется, есть слова, которые я не вижу, как робот Google мог бы придумать их.
Внутренние ссылки
Теперь это, скорее всего, какая-то внутренняя ссылка, потому что я просмотрел ваши титульные страницы в Google, и все, что я нашел, это 3 страницы, Pro Webmaster, еще один сайт, который отображает этот сайт и ваш. Похоже, что кто-то создал эту ссылку или приложение / плагин / вредоносная программа.
Исследуя
Таким образом, чтобы исключить, что ваши пользователи, вы сами или приложение создали эти ссылки, вам нужно войти в SQL (в идеале PHPMyadmin) и выполнить поиск строк. Убедитесь, что база данных чиста от этих страниц. Вы не получаете хиты, его время для поиска файлов кэша и файлов php для этих страниц. Если вы ничего не найдете, то, скорее всего, это связано с тем, что кто-то связал его с вами, а теперь его нет в Google, потому что его удалили.
Перенаправление
/?
строки может быть вредным, если кто-то хочет получить васТеперь я вижу, что вы удалили все
/?title=
строки и перенаправили их на домашнюю страницу, хотя это нормально, в то же время это может быть вредно, и я объясню ..Если кто-то спамит ваш сайт злостными обратными ссылками, худшее, что вы можете сделать, - это начать перенаправлять его на домашнюю страницу, так как Google может воспринимать это как манипулирование поиском страниц. Это связано с тем, что 301 перенаправляет поток сока с внешней ссылки, если эти ссылки происходят с сайта Viagra, то вы даете ложное указание Google на перенаправление, и это может вернуться и укусить вас.
Должен любить старые добрые 404-х годов
На страницах, которые просто не существуют, правильнее всего использовать 404, это совершенно нормально и никоим образом не создает у Google впечатления, что ваш сайт сломан. Любые страницы, которые не существуют, никогда не попадут в индекс Google, и те, кто снова ссылается на несуществующие страницы, не должны вредить вашему сайту, если возвращается 404, однако, как уже упоминалось, 301 на главную страницу «МОГУТ», потому что он сохраняет сок.
1-2 года назад я бы сказал, что перенаправление строк было лучшим способом, но со времен обновлений Google Panda и Penguin я видел сайты, пытающиеся всячески пытаться нанести ущерб репутации онлайн (в основном Panda, Penguin, наказывает сайты за обратные ссылки спама, платные ссылки). и вообще нерелевантные ссылки) Хотя Google утверждает, что невозможно нанести ущерб репутации других пользователей в Интернете, возникает вопрос, правда ли это, почему многие в настоящее время спамят других и откуда они знают, что веб-мастер не пытается манипулировать своими рейтингами? ? спорная область, но давайте подведем итоги ... Я считаю, что 404 подойдет вам лучше всего в этой ситуации.
Редактирование запроса должно быть прямым, а не перенаправление, чтобы
/
удалить строку, затем 301 в/404/
.источник