Изображения в кодировке Base64 и доступность их метаданных для Googlebot

9

Если я встраиваю изображение в страницу как img- srcс URI данных base64, остаются ли метаданные изображения (EXIF, IPTC, XMP) доступными для Google imagebot?

Евгений
источник
1
Возможно нет. Роботу Google, вероятно, нужен URL, на который он может ранжировать и направлять пользователей.
Джон Конде
1
Забудьте данные EXIF, я даже не уверен, что изображения Google будут даже индексировать изображение, которое не имеет своего собственного URL.
Стивен Остермиллер
@StephenOstermiller: вот в чем вопрос: если он индексирует такие изображения, значит, он также читает EXIF
Евгений
@Evgeniy Как отмечает Стивен, URI данных не отделены от содержащегося в них документа (подробнее об этом ). Поисковые системы индексируют URL-адреса, поэтому индексируются только содержащиеся в них документы, и то, будут ли они индексировать метаданные, содержащиеся в URI данных (если он действительно содержал это, делая его еще больше), является немым вопросом. Для подтверждения вы можете использовать механизм поиска исходного кода для поиска URI данных, а затем посмотреть, было ли это изображение проиндексировано и содержало ли EXIF ​​информацию в Google. Это кажется невероятным, хотя.
Дан
@Evgeniy Обратите внимание, что перекрестная публикация одного и того же вопроса на нескольких сайтах Stack Exchange не оправдывает себя.
Дан

Ответы:

6

Google не индексирует данные URI изображений для поиска изображений Google. Джон Мюллер из Google говорит об этом здесь и в комментариях ниже. Поскольку изображения URI данных не индексируются в поиске изображений Google, данные EXIF ​​в них не имеют значения.

Вы можете убедиться, что эти изображения не проиндексированы. Я искал в Google изображения "data uri" и проверил результаты. Все изображения, которые я просматривал, были файлами изображений, а не URI в кодировке Base64. Можно подумать, что если бы Google удалось проиндексировать изображения URI данных, некоторые из них будут отображаться в результатах поиска по этому термину.

Если Google когда-либо решит проиндексировать изображения URI данных, они смогут получить данные EXIF ​​из них. Data URI - это весь файл base64, закодированный (без пробелов и новых строк) с data:image/png;base64,префиксом. Любые метаданные в файле все равно будут присутствовать в версии URI с закодированными данными base64.

Я использую данные URI на одном из моих сайтов. Я делаю это потому, что пользователи обычно просто просматривают одну страницу на сайте, чтобы получить всю необходимую им информацию. Включение всех строчных данных CSS, JS и изображений на странице значительно повышает производительность. Изображения все маленькие, поэтому техника работает особенно хорошо.

Мой сайт получает достаточное количество трафика из Internet Explorer 7 и более ранних версий, которые не поддерживают изображения URI данных. Поэтому я должен обслуживать их условно. У меня также есть изображения на сервере, и я выбираю обычные URL-адреса изображений или URI данных на основе User-Agentзаголовка. Я отношусь к ботам (в том числе к Googlebot) так же, как к IE 7, то есть к изображениям я отношу HTTP-URL. Я делаю это потому, что включение данных URI изображений значительно увеличивает размер страницы. Большинству ботов не нужно загружать изображения, поэтому для них это более эффективно. Я также заметил, что Инструменты Google для веб-мастеров сообщили, что робот Googlebot сканирует мой сайт гораздо медленнее с включенными изображениями URI данных. Технически это можно было бы считать маскировкой, но это был бы способ индексации ваших изображений URI данных.

Стивен Остермиллер
источник
2
Ваш первый пример проиндексирован по этому URL: photos.topicshow.com/… а ваш второй по этому адресу: images5.fanpop.com/image/photos/30600000/… Во всех случаях, которые я мог найти, для изображения есть http-URL также.
Стивен Остермиллер
1
Зашифрованная строка @StephenOstermiller может содержать пробелы: goo.gl/RF8r07 . Я заполню изображение EXIF, закодирую его, опубликую и посмотрю, входит ли оно в индекс.
Евгений
3
Джон Мюллер (из Google) указывает здесь, что Google обычно не индексирует изображения из URI данных. Многие онлайн-инструменты, используемые для их кодирования, также удаляют метаданные, так что это действительно зависит от того, как они закодированы относительно того, поддерживается ли информация EXIF ​​... но, учитывая, что они в любом случае не проиндексированы, это спорный вопрос. Сообщите нам свои результаты (не позволяйте индексировать URL-адрес изображения - Google также использует функцию распознавания изображений, чтобы из сопоставленных изображений можно было использовать информацию EXIF).
Дан
1
@ Дэн, спасибо! Ваша ссылка на ответ Джона Мюллера теперь проясняет многие вещи! Если G не индексирует изображения, где он не может получить URI, поэтому не нужно думать о том, оставлен ли EXIF ​​внутри или нет.
Евгений
3
Как указано выше, в настоящее время мы не индексируем их как изображения отдельно. Это может измениться в будущем, но по крайней мере на данный момент вы захотите использовать отдельные URL-адреса изображений, если хотите, чтобы эти изображения были проиндексированы в Поиске изображений.
Джон Мюллер,
2

Хотя Google использует изображения в качестве URI-кодов данных в кодировке Base64 на своей собственной выдаче, она не индексирует такие изображения на других веб-сайтах. Спасибо @dan, который указал мне на обсуждение групп Google, где Джон Мюллер объясняет эту проблему . Это также означает, что вопрос о существовании данных EXIF ​​на таких изображениях не актуален.

Из этого объяснения становится ясно, к каким изображениям лучше применять эту технику оптимизации производительности: маленькие изображения, такие как значки, значки и кнопки, и те изображения, которые не несут никакой дополнительной ценности для контента сайта.

На другом сайте, если один должен категорически встраивать изображение с дополнительным значением контента в качестве URI данных в кодировке base64, единственная лучшая практика для предоставления метаданных изображения - это использовать разметку Schema.org, где возможно согласование данных EXIF, например, с этим вид разметки.

Еще один многообещающий вид разметки для согласования данных, имеющих вид «свойство: значение», например EXIF, в настоящий момент имеет статус предложения. Но эта статья из блога Google показывает структурированные фрагменты, которые могут быть сгенерированы предложением разметки, которое я связал выше.

Евгений
источник