Недавно я заметил, что у меня есть растущий список ошибок Soft 404 в Google Webmaster Tools. Все они предназначены для динамически генерируемых страниц с результатами поиска, которые сообщают "Совпадений не найдено".
Я действительно понимаю , что означает , что Google с помощью Soft 404 и почему они сообщают о его для этих страниц. Поэтому я добавил <meta name="robots" content="noindex">
к этим страницам.
Однако Google по-прежнему сообщает о новых ошибках Soft 404 для страниц, использующих метатег noindex .
Почему Google сообщить любую ошибку на странице , я сказал им , не индексировать?
Проблема в том, что со всеми этими нежелательными ошибками я не вижу, есть ли реальные проблемы, которые нужно исправить.
Некоторые говорят, что эти страницы должны возвращать код состояния 404. Но это только переносит проблему на вкладку 404 ошибок. Кроме того, Google возвращает код состояния 200 для их страницы без результатов .
Я не хочу блокировать доступ с robots.txt, потому что я хочу, чтобы ссылки на этих страницах следовали, и я хочу, чтобы Google видел метатег noindex . Кроме того, нет никакого шаблона, который я мог бы использовать, чтобы заблокировать их.
Google нашел эти URL в первую очередь потому, что контент раньше существовал, но с тех пор был удален. Я не могу вернуть код состояния 410, потому что мой код PHP не может узнать причину, по которой не было найдено никаких результатов.
Что я могу сделать, чтобы было легче увидеть реальные проблемы?
источник
Ответы:
Вы должны запретить Google сканировать страницы поиска по сайту. Google не хочет сканировать ваш поиск по сайту вообще . Вот сообщение в блоге Мэтта Каттса от Google о проблеме: Результаты поиска в результатах поиска Мэтта Каттса от 10 марта 2007 года . В настоящее время Google активно наказывает сайты, которые позволяют сканировать результаты поиска по их сайту и отображаться в поисковой выдаче Google. Позволяя роботу Googlebot сканировать страницы результатов поиска, вы рискуете всем своим трафиком рефералов Google. Один из любимых приемов рецензента Google - использовать поиск по сайту для таких терминов, как «Виагра». Когда они видят просматриваемую страницу в качестве результата (даже если она говорит «никаких результатов для Виагры не найдено»), они будут применять ручное наказание к вашему сайту как спам-сайту.
Вы должны поставить свой поиск по сайту в
robots.txt
. Просто убедитесь, что робот Googlebot все еще может сканировать ваши контентные страницы. После этого вы перестанете получать новые сообщения об ошибках soft 404.Большое количество 404 ошибок (даже мягких 404 ошибок) не влияет на рейтинг вашего сайта. Google сообщает об ошибках на любой странице, которую они могут найти и сканировать, независимо от того, хотите ли вы, чтобы она была проиндексирована, и даже если вы даже не ссылаетесь на нее. Они делают это, потому что сообщения об ошибках предназначены исключительно для вашей выгоды, и они чувствуют, что вы должны быть полностью информированы.
Вот что говорит по этому поводу Джон Мюллер из Google :
источник