Потому что это выглядит так. Для моих сайтов мы запрещаем каталог изображений, а в предварительном просмотре отсутствуют изображения, из-за чего сайт выглядит странно.
Это так, и есть ли способ разрешить только боту предварительного просмотра доступ к изображениям с помощью robots.txt?
РЕДАКТИРОВАТЬ: Похоже, превью создаются как обычным ботом Google, так и встроенным ботом Google Web Preview, как уже упоминалось (кратко) в блоге для веб-мастеров .
Используя сайт: search и мое программное обеспечение для мониторинга, я мог видеть, когда бот попал на мой сайт, и когда это произошло, изображения хорошо отображались в предварительном просмотре. Поэтому я предполагаю, что обычный сканер игнорирует изображения в файле robots.txt, но сканер предварительного просмотра получает изображения в любом случае.
Эта реализация кажется немного неуклюжей, потому что мои варианты выглядят так:
- разрешить роботу Google сканировать мои изображения (что я не хочу делать)
- используйте тег nosnippet, который блокирует предварительный просмотр, но также фрагменты (что я не хочу делать)
- Пусть появятся шаткие превью, которые могут отрицательно повлиять на количество кликов
источник
Ответы:
Я думаю, что Джон Мюллер понял это прямо в комментариях.
Я не знал, что вы можете позволить Google сканировать контент без его индексации. Я поставил его технику на место и просто жду, когда его переползут, чтобы посмотреть, сработает ли он.
Я приму это как ответ через несколько дней, если Джон не захочет добавлять свои комментарии в раздел ответов, чтобы он мог заработать репутацию.
источник
Поскольку большая часть предварительного просмотра выполняется сканером ботов Google, блокировка сканирования некоторой части вашего сайта повлияет на предварительный просмотр ...
Почему вы не хотите, чтобы бот Google сканировал ваши изображения?
источник
Ниже приведено техническое решение, которое может или не может быть просто применить к вашему сайту.
Возможно (даже вероятно), что Google предложит способ сделать это с помощью всего нескольких подсказок в метаданных или robots.txt, но до тех пор ....
Шаг 1.
Создайте службу перенаправления / сервлет для изображений на первой странице.
Т.е. URL вроде
/frontpageimages/[image name]
что делает сервер перенаправления на
/images/[image name]
Шаг 2.
Переписать все ссылки на изображения на главной странице (и только на первой странице), чтобы пройти через службу перенаправления, начиная с шага 1, вместо прямой ссылки на изображение.
Шаг 3.
Убедитесь, что robots.txt позволяет сканировать googlebot
/frontpageimages/
Это должно гарантировать, что Google может сканировать любые изображения, с которыми он сталкивается, на вашей главной странице, оставляя изображения только на других страницах.
Хотя служба перенаправления (теоретически) может использоваться для сканирования всех ваших изображений без технического нарушения вашего файла robots.txt, роботы с хорошим поведением (например, googlebot) не будут этим заниматься. И роботы с плохим поведением не будут беспокоиться о robots.txt.
источник