Почему Google не может найти структурированные данные на большинстве моих проиндексированных страниц?

13

У меня есть веб-сайт с примерно 30000 страниц. Индекс Google в порядке, почти все страницы проиндексированы, но в структурированных данных я вижу только 48 страниц, обнаруженных для schema.org. Schema.org идентичен всему сайту.

Мой вопрос: почему между индексированными страницами и страницами с разметкой существует такая большая разница?

Особенно я усердно работал, чтобы реализовать все подходящие схемы для моего сайта, и теперь Google не обнаруживает их.

Проиндексированные страницы - более 27 000 Структурированные данные в инструментах для веб-мастеров - 48 страниц

Страницы с schema.org - 48 Проиндексированные страницы в инструментах для веб-мастеров - более 27 000

DFuchidzhiev
источник
5
Инструменты для веб-мастеров могут не спешить сообщать о результатах, так как они не в реальном времени, кроме того, может потребоваться также несколько обходов. Важный вопрос заключается в том, сколько ваших URL-адресов сканирует Google в месяц, я очень сомневаюсь в 27 000, поскольку ожидал увидеть большее число. Google всегда будет индексировать и обновлять самые популярные страницы, так как они сканируются чаще, некоторые URL, которые не обновлялись месяцами, могут занять дни, недели или даже месяцы для обновления.
Саймон Хейтер
5
Чтобы обновить то, что сказал @bybe (один голос за комментарий). У Google есть метрика стиля TTL для каждой страницы. Если страница новая или обновляется не часто, Google не будет часто ее посещать. Если страница свежая и часто меняется, то время TTL для страницы будет со временем уменьшаться, и Google будет чаще посещать эту страницу. Свежесть - важный показатель в вашем сценарии. Если ваш сайт стандартен по свежести, то Google может потребовать немало времени, чтобы обнаружить изменения. Если ваш сайт новый, то он может проверить свежесть с некоторыми примерами запросов.
closetnoc
В моем случае это новый веб-сайт - это видно из рисунка проиндексированных страниц - он начинается в августе 2014 года. Bybe - я прошу не просканированные страницы, а индексированные. И я могу ожидать, что те моменты, которые вы оба заметили, но я спрашиваю разницу между проиндексированными страницами и страницами с разметкой схемы. В то время как содержимое может часто изменяться или нет, схема является частью структуры HTML. И этот вопрос очень важен для меня, потому что я начинаю усердно работать с schema.org для каждого моего проекта, как это рекомендует Google.
Д.Фучиджиев
Как я уже сказал, это может занять несколько сканирований и может занять больше времени для его появления в Инструментах для веб-мастеров. Кроме того, требуется больше времени для того, чтобы эти схемы действительно появлялись в поисковых системах, т. Е. В звездах, ценах на бирже и других льготах, которые появляются в результатах поиска (обычно 2-3 месяца). До тех пор, пока ваш код проверяется нормально в тесте расширенного фрагмента, вы мало что можете сделать ... просто скажите клиентам, что это занимает 2-3 месяца, и вы никогда не должны обещать, что в результатах появятся расширенные данные, поскольку Google не всегда возвращает данные в реальных результатах.
Саймон Хейтер

Ответы:

5

Вот как это работает, основываясь на сайтах, которые мы недавно выпустили + пару, которые работали некоторое время.

Предполагая, что это новый сайт, использующий все возможности Schema.org, а также резервный data-vocab для данных о крошках и обзорах, вы должны ожидать как минимум 3-месячного лага. Вы увидите, что отчеты схемы инструментов Google для веб-мастеров ничего не делают - никаких новых обзоров, никаких новых страниц ... даже всплески, а затем пропадание количества или ложных срабатываний. Не волнуйтесь, это просто GADHD. Однажды во 2-м месяце вы можете увидеть, как все показатели начинают заполняться, выравниваться и стабилизироваться. Вы можете увидеть, как активируются аварийные виджеты SERP data-vocab на страницах с новым трафиком. Через месяц после этого виджеты SERP schema.org должны активироваться при условии, что в GWT нет ошибок. Вы можете заметить туда и обратно, особенно для обзоров, цены и т. Д. В течение этого времени. Однажды они будут включены, другой выключен. Один запрос включен, другой выключен. В конце концов, результаты поисковой выдачи стабилизируются,

Как указывает closetnoc в комментарии к исходному вопросу, RDF запускается из свежих основных данных / страниц. Это может занять намного больше, чем 3 месяца для тех скрытых страниц, которые никогда не получают хиты, возможно, до года для действительно устаревших. Это хорошая идея, чтобы освежить области, которые вы хотите активировать виджеты SERP. Google покажет, что они имеют индексированный RDF в GWT и готовы к работе, но фактические виджеты SERP не будут активированы, пока не разрешит триггер. Этот триггер новый / трафик / интерес / поиски на ваших уже проиндексированных страницах RDF.

Просто будьте терпеливы и ожидайте увидеть множество флуктуаций и несоответствий. Вот так, как катится индекс ботов RDF с механизмом прогнозирования + поп-запросы, я думаю.

dhaupin
источник
1
Повторное посещение этого ответа. Похоже, что Google+ вошел в статус в сочетании с G + local для бизнеса, влияет на скорость, с которой ваши SERPS показывают структурированные данные. В целом, они, похоже, отслеживают социальный + местный интерес на уровне SERP и кажутся более либеральными в богатых фрагментах, которые они там показывают. Например, звездочки обзора могут показывать пользователю G + и любому не-G + пользователю в вашей местности. Принимая во внимание, что может потребоваться еще один месяц для того, чтобы те же самые звезды показывались для остального мира, не вошедшего в систему. Мораль комментария: убедитесь, что вы установили G + local для своего сайта (ов), а затем подтвердите, что вы тоже издатель.
дхаупин
Обратите внимание, что мои инструменты для веб-мастеров начали показывать мои структурированные данные через 6 дней после их
Мэтт Вилко