WordPress с SOFT 404 в Google Search Console (WMT) Что вызывает Q82019309.com?

8

Сайт моего брата, который я разработал для него некоторое время, содержит сотни SOFT 404, о которых сообщалось в консоли поиска Google, ранее принадлежавшей Инструментам для веб-мастеров. Как правило, я считаю, что крепление софт 404 легко, но это меня немного озадачило. Все мягкие ошибки возвращают нечетную строку, содержащую Q82019309.comслучайную подпапку Aristocratв строке /?=.

404 в целом выглядят примерно так:

  • закодированные: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Раскодированный: /search/大奖总代Q82019309.com

Ссылка на информацию обеспечивает:

  • закодированные: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Раскодированный: /?s=大奖总代Q82019309.com

Сначала я полагал, что это была изолированная проблема, но после исследования я обнаружил, что эта проблема действительно затрагивает тысячи веб-сайтов, и кто-то должен знать причину. Когда я захожу в Google Q82019309.com на WordPress или на Aristocrat Q82019309.com, я поражен количеством результатов, включая некоторые авторитетные сайты, такие как:

Вопросов):

Так что вызывает эти мягкие ошибки 404 со строкой Q82019309.comс или без Aristocrat.

Саймон Хейтер
источник
Ваш сайт был взломан. Q82019309.com взломан.
closetnoc
Переходя на сайт Q82019309.com говорит, что это сайт атаки, и я согласен, что он хитрый, но мне трудно поверить, что все эти сайты были взломаны с помощью чего-то, что использует строку запроса в поиске. Существуют литературные сотни тысяч веб-сайтов, которые сообщают о Q82019309.com ... весьма уважаемые ... конечно, не все они взломаны?
Саймон Хейтер
Ссылки кажутся спамом. Очень типичный профиль. Кроме того, это, кажется, характерно для сайтов WP. Это, кажется, довольно недавно, в течение нескольких дней (4 или около того). Проверьте установку WP, чтобы убедиться, что все обновлено. См .: web.nvd.nist.gov/view/vuln/…
closetnoc
Был обнаружен более недели назад 13-го.
Саймон Хейтер
Подумайте, мне нужно будет просмотреть ошибки errors.log и access.logs, чтобы определить, пытался ли кто-нибудь попытаться войти в систему с помощью нового хака.
Саймон Хейтер

Ответы:

2

У нас была такая же проблема на wisepops.com с 3 января 2017 года.

Google жалуется на Soft 404, даже если индексация на этих страницах отключена. Страница поиска Wordpress по умолчанию имеет эту мету:

<meta name="robots" content="noindex,follow">

Я решил заставить страницы поиска без результатов возвращать код HTTP 404. Поскольку поисковый запрос находится в URL-адресе, с этим можно справиться.

Для Wordpress я добавил в конце своей темы functions.php:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');
Wisepops
источник
@ wisepops.com: у меня та же проблема с этой глупой атакой поискового спама. Спасибо за код! Это отлично сработало для меня! Теперь пустой поиск возвращает чистый 404, и это круто. С уважением, Митчу
Митчу
Будет ли это отправлять фактического пользователя, который делает поиск и получает ноль результатов, также на страницу 404?
brandozz
1

Мне кажется, что вы что-то связываете с поиском по вашему сайту с плохими запросами. Эти поисковые запросы получают "результатов не найдено". Робот Googlebot находит эти ссылки, и вы позволяете роботу Google сканировать поиск по сайту. Из-за "нет результатов" Google определяет их как "soft 404".

Позволить Google сканировать результаты поиска на вашем сайте - это просто нет. Он может оштрафовать весь ваш сайт Google. См. Мэтт Каттс: Результаты поиска в результатах поиска . Вы должны запретить весь просмотр результатов поиска, используя robots.txt :

Disallow: /search
Disallow: /?s=

Тогда робот Google не будет сканировать эти URL-адреса и сообщать об ошибках там же.

Стивен Остермиллер
источник
Стивен, это восстановило мягкие 404? Я на самом деле добавил это в свой robots.txt и пометил все мои программные 404 на странице поиска как исправленные. Как только я проверю, я отмечу это как правильное. Но это, кажется, лучшее решение.
brandozz