Что может вызвать «Обнаружено - в настоящее время не проиндексировано» в новом GWT

18

Новый GWT показывает ссылки на карты сайта, разделенные на новые категории. Два, которые меня смущают: 1. Обнаружено - в настоящее время не проиндексировано 2. Просканировано - в настоящее время не проиндексировано

Каковы возможные причины этого, и есть ли какие-либо последствия для сайта? Это знак от Google, я должен рассмотреть их удаление?

введите описание изображения здесь

Ноам
источник

Ответы:

11

Это просто часть процесса. Вам нечего делать, пока вы на самом деле не получите ошибки .

Чтобы понять категории, вам нужно понять, как работает индексирование, что происходит постоянно:

  • Googlebot выбирает страницу, что означает загрузку ее контента на серверы Google. Когда это происходит, страница сканируется .
  • Позже он помещает содержимое загруженной страницы в указатель. Это означает, что страница проиндексирована .
  • При сканировании страницы он находит лайки и помещает их в очередь. Эти ссылки обнаружены .

Так:

  • Обнаружено, не проиндексировано означает, что ссылка была добавлена ​​в очередь вещей, которые робот Google может в конечном итоге сканировать. Так как сеть практически бесконечна и существует расстановка приоритетов, она может никогда не попасть туда.
  • Отсканированный в данный момент не проиндексированный означает, что страница была загружена на серверы Google, но ее содержимое не было вставлено в индекс.
Итай
источник
1
Я бы добавил, что Google решает, что сканировать, основываясь на PageRank. Ссылки на страницу чаще или заметнее (даже внутри) могут заставить робота Google сканировать ее.
Стивен Остермиллер
3
Я думаю, что «в настоящее время не индексируется» также может означать, что Google решил не индексировать его. Это может быть дубликат или выглядеть некачественно. Это может не хватить Pagerank. Google может подумать, что он не будет соответствовать достаточному количеству запросов.
Стивен Остермиллер
Это то, на что я намекал с расстановкой приоритетов . Это происходит со ссылками, которые предположительно дублируются (иногда потому, что они отличаются только по параметру или соответствуют другому каноническому).
Итай
Страницы выпадают и выходят из "Просканировано, но не проиндексировано" без моего внимания. Информация также сомнительна. Пример: проверенный URL приводит к сообщению, что он проиндексирован, но не в какой-либо карте сайта ... страница находится в карте сайта и существует уже много лет. Недавнее обновление алгоритма отправило этот отчет туда-сюда.
GLCoder
3

Google может обнаруживать и сканировать ваши страницы, но это не значит, что они обязательно будут их индексировать.

Есть много причин, по которым Google может не проиндексировать страницу. Возможно, он нашел дублированный контент. Возможно, он не считает, что он предлагает достаточно значения для каких-либо конкретных поисковых запросов. Google может найти что-то о вашей странице, что ему не нравится.

Какой бы ни была причина, Google просто не решил индексировать некоторые страницы, которые он обнаружил и просканировал на вашем сайте. Вполне нормально, что некоторые ваши страницы не индексируются. Некоторые страницы на моих сайтах не индексируются, несмотря на то, что они имеют лучшее содержание, чем многие проиндексированные страницы, и содержат значительное количество внутренних ссылок. Система индексации Google - это алгоритм машинного обучения. И поэтому он может решить не индексировать некоторые страницы иногда по ряду неизвестных причин.

Майкл д
источник
1
«Возможно, обнаружен дублированный контент»> Я хотел бы добавить, что в этом случае, хотя сообщение «Обнаружено - в данный момент не проиндексировано», это указывает на то, что страница даже не была выбрана (или будет «просканирована»). - в настоящее время не индексируется »). Так что на данный момент они ничего не знают о его содержании. Поэтому я думаю, что на данном этапе расстановка приоритетов зависит от самого URL-адреса, количества ссылок на него и возможных других вещей.
Niavlys
2

Googlebot имеет свою очередь, основанную на разных параметрах. Это сообщение о тех URL, которые даже стоят в очереди.

введите описание изображения здесь

У Aj Cohn довольно странное мнение о значении этого сообщения:

Обнаружено - в настоящее время не проиндексированное, похоже, указывает на то, что они видят его в вашей карте сайта, но, основываясь на том, как выглядит другой контент, они даже не собираются его сканировать. По сути, «Ужасно!» Или, может быть, это просто представление о низкой эффективности сканирования.

Честно говоря, я не совсем уверен, что определение Discovered является точным, поскольку многие примеры URL-адресов в этом статусе имеют дату последнего сканирования. Это противоречит приведенному определению.

Евгений
источник
2
Я удалил бит "прочитать руководство". Это не полезно. Тем более что документация Google довольно скудная.
Стивен Остермиллер
0

Несмотря на то, что Google обнаружил URL, он не чувствовал, что это достаточно важно, чтобы тратить время на сканирование. Если вы хотите, чтобы эта страница получала обычный поисковый трафик, рассмотрите возможность добавления ссылок на нее с вашего собственного веб-сайта. Обязательно продвигайте этот контент другим в надежде, что вы сможете получать обратные ссылки с внешних сайтов. Внешние ссылки на ваш контент - это сигнал Google о том, что страница является ценной и считается заслуживающей доверия, что увеличивает шансы ее индексации.

tsogtgerel.ts
источник