Как удалить URL из поисковой системы Google

10

Я использовал так много вещей, как запрос на удаление URL, удалил страницы и т. Д., Но все же ошибки отображаются в моих инструментах для веб-мастеров.

Как я могу полностью удалить URL из Google?

paulmorriss
источник

Ответы:

6

Вы можете: Удалить страницу или сайт из результатов поиска Google , но пройдет некоторое время, прежде чем они вступят в силу.

Джон Конде
источник
Я запросил удаление каталога через панель веб-мастеров, сколько времени это займет? Я также запретил каталог через файл robots.txt.
Роб
4

В общем, вы не можете. Но есть несколько вариантов.

Один из вариантов - полностью удалить страницы с вашего сервера и убедиться, что они отвечают 404 ошибками.

Другой способ - использовать robots.txtфайл, чтобы предотвратить сканирование контента Google. Это, безусловно, предотвратит индексацию новых страниц, но может потребоваться некоторое время, чтобы существующие страницы больше не отображались.

Последний вариант - использовать noindexметатег.

Подробнее см. На странице Google по этой теме: http://www.google.com/support/webmasters/bin/answer.py?hl=ru&answer=164734.


источник
3

Краткий ответ в контексте практичности: вы не можете .

Что вы можете сделать, это удалить ссылки, которые указывают на них, и убедиться, что страницы отвечают кодом состояния 404, а когда Google обнаружит, что страницы больше не существуют, они в конечном итоге очистят их от результатов.


источник
Это должно быть 410 Goneне404 Not Found
Квентин
2

Если на вашем сайте есть страницы, проиндексированные в Gooogle, которые вы хотите удалить, первым делом нужно изменить свой сайт. Вы можете удалить страницы, заблокировать их просмотр роботом Googlebot или включить в них тег, который говорит Google не индексировать их.

  • 410 Gone - удаление страниц со статусом 410 позволяет роботу Google удалять их из индекса, как только он сканирует их в следующий раз.
  • 404 Not Found - робот Googlebot удалит 404 URL-адреса по истечении 24 льготных периодов при следующем сканировании.
  • Тег noindex - если страница все еще доступна на сайте, но не должна быть проиндексирована, включите ее <meta name="robots" content="noindex">в <head>раздел. Google удалит его из индекса при следующем сканировании.
  • Защита паролем - Защитите информацию, запрашивая логин или пароль для доступа к ней. В этом случае Google может проиндексировать URL, но не сможет проиндексировать контент.
  • Запретить в robots.txt - вы можете запретить роботу Googlebot сканировать страницы, добавив Disallow: /mypageв robots.txt. Google обычно не индексирует страницы, которые он не может сканировать, и никогда не индексирует их содержание. Однако Google иногда может показывать URL в результатах поиска без какого-либо фрагмента :

    введите описание изображения здесь

    Если вы удалили страницу или добавили noindexтег, важно разрешить роботу Googlebot сканировать страницу. Если вы также запретите сканирование в файле robots.txt , робот Googlebot не сможет увидеть, что ваша страница должна быть удалена. Не запрещайте страницы в robots.txt, если вы также реализовали другой метод из этого списка.

При всех этих методах робот Googlebot должен возвращать и сканировать страницы, прежде чем они будут удалены. Этот процесс может занять пару месяцев , особенно для многих страниц, которые не очень популярны. Если вы хотите ускорить процесс, войдите в консоль поиска Google и используйте функцию Fetch as Google для каждого URL. Обратите внимание, что это ручной процесс с квотой в десять запросов в день, поэтому он не будет работать для большого количества URL-адресов.

У Google также есть инструмент Удалить URL-адреса в консоли поиска, который может временно удалять URL-адреса или каталоги из Google на 90 дней. Вы можете использовать этот инструмент для быстрого удаления URL-адресов из результатов поиска, прежде чем робот Googlebot сможет их сканировать.

Даже после удаления URL-адресов из результатов поиска Google, Google все равно может отображать URL-адреса как ошибки в консоли поиска Google. Пока Google находит ссылки на URL-адреса, они могут отображаться как ошибки сканирования после того, как они имеют статус 404 или 410. Это совершенно нормально и не повредит другим страницам на вашем сайте. Посмотрите, что говорит Джон Мюллер из Google об ошибках сканирования для получения дополнительной информации.

Стивен Остермиллер
источник
1

Есть два способа удалить URL из поисковой системы Google

1-й

Если вы не хотите сканировать свою страницу в Google, вам необходимо использовать инструмент URL-адрес для удаления инструмента Google для веб-мастеров, чтобы запросить его удаление.

  • Войдите в свой инструмент для веб-мастеров
  • перейти к настройке сайта
  • перейти к доступу Crawler
  • перейдите на вкладку Crawler access
  • Внесите свой URL в новый запрос на удаление

Через несколько дней ваш URL будет удален из поисковой системы и не сможет сканировать.

второй

Если на вашем сайте есть контент, к которому вы не хотите, чтобы Google или другие поисковые системы обращались, используйте файл robots.txt и запретите папку этой веб-страницы.

Вы можете использовать один из приведенных выше шагов, чтобы удалить URL из поисковой системы Google

Ниши
источник