Гриф, чтобы украсть страничку с моего сайта?

8

Сегодня я искал в своем инструменте Google Webmaster для своего сайта и вижу дубликаты названий для следующих страниц на моем сайте (небольшая выборка из многих в моем индексе сайта):

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

Это, конечно, не страницы, которые я создал!

Я также посмотрел на свои структурированные данные, которые я создал на своем сайте, и я вижу это (небольшой пример из многих):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

Ничто из этого не является результатом того, что я сделал. Это, очевидно, какое-то горе или сложный план, чтобы украсть страничку.

Вчера я установил на всех своих страницах php автоматизированные перенаправления и канонические ссылки 301, чтобы попытаться это исправить (благодаря некоторой замечательной помощи от людей, переполняющих стек). Но я хотел бы больше узнать об этом и какова их цель.

Эми Невилл
источник
1
Даже если вы не сделали заголовки страниц, эти страницы были чем-то, что вы создали? Вы позволяете людям создавать страницы на вашем сайте и так далее? Расскажите нам больше о данном сайте, так как на данный момент его догадываются. Это может быть вредоносное ПО, это может быть ваша система управления контентом, предоставляющая несколько URL с разными названиями, это могут быть люди, пытающиеся навредить вашей репутации (Сомнительное мнение). Пожалуйста, отредактируйте свой вопрос и дайте нам лучшее представление о сайте, который вы используете, с указанными мною ключевыми точками, а также URL-адрес соответствующего сайта имеет большое значение для таких тем.
Саймон Хейтер
Это не страницы, которые я создал. Однако я заметил, что в моей вики есть страница, предназначенная для представления несозданных страниц, и не сообщается об ошибке 404
Эми Невилл
Структура структурированных данных совершенно странная, хотя я просто не понимаю, откуда это вообще может прийти.
Эми Невилл
1
Привет, Эми, думаю, что я понял, и хотя некоторые следственные работы, я думаю, у меня есть для тебя ответ, хотя тебе это может не понравиться;)
Саймон Хейтер
1
Привет, я работаю с командой Google Webmaster Tools. Это была проблема с нашей стороны, которая затронула только инструмент тестирования структурированных данных и соответствующую панель инструментов в Инструментах для веб-мастеров. Это не повлияло на поиск в Интернете, и, скорее всего, это не было тем, что было найдено на вашем сайте. Извините за путаницу!
Джон Мюллер

Ответы:

6

Некоторые пути, по которым несуществующие страницы попадают в индекс Google

Существует 3 способа, которыми несуществующие страницы могут оказаться в Google или любой другой поисковой системе по этому вопросу, а именно:

  • Ваши страницы ссылаются на эти страницы. (Это может быть карта сайта, страница профиля, комментарий в блоге или ссылка на основе ссылки href ...) Я видел, например, некоторые плагины из WordPress, которые содержат такие ссылки, потому что они были разработаны на одном сайте и затем загружены в библиотека плагинов, но у разработчика есть настройка кеша, с которой столкнулся плагин.

  • Обратная ссылка указывает на эти страницы.

  • Я видел страницы индекса Google и строки, которые просто не существуют, хотя у вас, кажется, есть слова, которые я не вижу, как робот Google мог бы придумать их.

Внутренние ссылки

Теперь это, скорее всего, какая-то внутренняя ссылка, потому что я просмотрел ваши титульные страницы в Google, и все, что я нашел, это 3 страницы, Pro Webmaster, еще один сайт, который отображает этот сайт и ваш. Похоже, что кто-то создал эту ссылку или приложение / плагин / вредоносная программа.

Исследуя

Таким образом, чтобы исключить, что ваши пользователи, вы сами или приложение создали эти ссылки, вам нужно войти в SQL (в идеале PHPMyadmin) и выполнить поиск строк. Убедитесь, что база данных чиста от этих страниц. Вы не получаете хиты, его время для поиска файлов кэша и файлов php для этих страниц. Если вы ничего не найдете, то, скорее всего, это связано с тем, что кто-то связал его с вами, а теперь его нет в Google, потому что его удалили.

Перенаправление /?строки может быть вредным, если кто-то хочет получить вас

Теперь я вижу, что вы удалили все /?title=строки и перенаправили их на домашнюю страницу, хотя это нормально, в то же время это может быть вредно, и я объясню ..

Если кто-то спамит ваш сайт злостными обратными ссылками, худшее, что вы можете сделать, - это начать перенаправлять его на домашнюю страницу, так как Google может воспринимать это как манипулирование поиском страниц. Это связано с тем, что 301 перенаправляет поток сока с внешней ссылки, если эти ссылки происходят с сайта Viagra, то вы даете ложное указание Google на перенаправление, и это может вернуться и укусить вас.

Должен любить старые добрые 404-х годов

На страницах, которые просто не существуют, правильнее всего использовать 404, это совершенно нормально и никоим образом не создает у Google впечатления, что ваш сайт сломан. Любые страницы, которые не существуют, никогда не попадут в индекс Google, и те, кто снова ссылается на несуществующие страницы, не должны вредить вашему сайту, если возвращается 404, однако, как уже упоминалось, 301 на главную страницу «МОГУТ», потому что он сохраняет сок.

1-2 года назад я бы сказал, что перенаправление строк было лучшим способом, но со времен обновлений Google Panda и Penguin я видел сайты, пытающиеся всячески пытаться нанести ущерб репутации онлайн (в основном Panda, Penguin, наказывает сайты за обратные ссылки спама, платные ссылки). и вообще нерелевантные ссылки) Хотя Google утверждает, что невозможно нанести ущерб репутации других пользователей в Интернете, возникает вопрос, правда ли это, почему многие в настоящее время спамят других и откуда они знают, что веб-мастер не пытается манипулировать своими рейтингами? ? спорная область, но давайте подведем итоги ... Я считаю, что 404 подойдет вам лучше всего в этой ситуации.

Редактирование запроса должно быть прямым, а не перенаправление, чтобы /удалить строку, затем 301 в /404/.

Саймон Хейтер
источник
не позволяет мне голосовать, но это отличный ответ, спасибо
Эми Невилл
Никаких проблем, теперь получите Lucky Charms на всех ваших рекламных щитах;)
Саймон Хейтер
@SimonHayter Google берет ответ HTTP 404 и игнорирует содержимое страницы? Что вы думаете о странице 404, которая перенаправляет JavaScript на домашнюю страницу? Просто любопытно последствия
Джонатан