Изображения в кодировке Base64 и доступность их метаданных для Googlebot
9
Если я встраиваю изображение в страницу как img- srcс URI данных base64, остаются ли метаданные изображения (EXIF, IPTC, XMP) доступными для Google imagebot?
Возможно нет. Роботу Google, вероятно, нужен URL, на который он может ранжировать и направлять пользователей.
Джон Конде
1
Забудьте данные EXIF, я даже не уверен, что изображения Google будут даже индексировать изображение, которое не имеет своего собственного URL.
Стивен Остермиллер
@StephenOstermiller: вот в чем вопрос: если он индексирует такие изображения, значит, он также читает EXIF
Евгений
@Evgeniy Как отмечает Стивен, URI данных не отделены от содержащегося в них документа (подробнее об этом ). Поисковые системы индексируют URL-адреса, поэтому индексируются только содержащиеся в них документы, и то, будут ли они индексировать метаданные, содержащиеся в URI данных (если он действительно содержал это, делая его еще больше), является немым вопросом. Для подтверждения вы можете использовать механизм поиска исходного кода для поиска URI данных, а затем посмотреть, было ли это изображение проиндексировано и содержало ли EXIF информацию в Google. Это кажется невероятным, хотя.
Дан
@Evgeniy Обратите внимание, что перекрестная публикация одного и того же вопроса на нескольких сайтах Stack Exchange не оправдывает себя.
Дан
Ответы:
6
Google не индексирует данные URI изображений для поиска изображений Google. Джон Мюллер из Google говорит об этом здесь и в комментариях ниже. Поскольку изображения URI данных не индексируются в поиске изображений Google, данные EXIF в них не имеют значения.
Вы можете убедиться, что эти изображения не проиндексированы. Я искал в Google изображения "data uri" и проверил результаты. Все изображения, которые я просматривал, были файлами изображений, а не URI в кодировке Base64. Можно подумать, что если бы Google удалось проиндексировать изображения URI данных, некоторые из них будут отображаться в результатах поиска по этому термину.
Если Google когда-либо решит проиндексировать изображения URI данных, они смогут получить данные EXIF из них. Data URI - это весь файл base64, закодированный (без пробелов и новых строк) с data:image/png;base64,префиксом. Любые метаданные в файле все равно будут присутствовать в версии URI с закодированными данными base64.
Я использую данные URI на одном из моих сайтов. Я делаю это потому, что пользователи обычно просто просматривают одну страницу на сайте, чтобы получить всю необходимую им информацию. Включение всех строчных данных CSS, JS и изображений на странице значительно повышает производительность. Изображения все маленькие, поэтому техника работает особенно хорошо.
Мой сайт получает достаточное количество трафика из Internet Explorer 7 и более ранних версий, которые не поддерживают изображения URI данных. Поэтому я должен обслуживать их условно. У меня также есть изображения на сервере, и я выбираю обычные URL-адреса изображений или URI данных на основе User-Agentзаголовка. Я отношусь к ботам (в том числе к Googlebot) так же, как к IE 7, то есть к изображениям я отношу HTTP-URL. Я делаю это потому, что включение данных URI изображений значительно увеличивает размер страницы. Большинству ботов не нужно загружать изображения, поэтому для них это более эффективно. Я также заметил, что Инструменты Google для веб-мастеров сообщили, что робот Googlebot сканирует мой сайт гораздо медленнее с включенными изображениями URI данных. Технически это можно было бы считать маскировкой, но это был бы способ индексации ваших изображений URI данных.
Зашифрованная строка @StephenOstermiller может содержать пробелы: goo.gl/RF8r07 . Я заполню изображение EXIF, закодирую его, опубликую и посмотрю, входит ли оно в индекс.
Евгений
3
Джон Мюллер (из Google) указывает здесь, что Google обычно не индексирует изображения из URI данных. Многие онлайн-инструменты, используемые для их кодирования, также удаляют метаданные, так что это действительно зависит от того, как они закодированы относительно того, поддерживается ли информация EXIF ... но, учитывая, что они в любом случае не проиндексированы, это спорный вопрос. Сообщите нам свои результаты (не позволяйте индексировать URL-адрес изображения - Google также использует функцию распознавания изображений, чтобы из сопоставленных изображений можно было использовать информацию EXIF).
Дан
1
@ Дэн, спасибо! Ваша ссылка на ответ Джона Мюллера теперь проясняет многие вещи! Если G не индексирует изображения, где он не может получить URI, поэтому не нужно думать о том, оставлен ли EXIF внутри или нет.
Евгений
3
Как указано выше, в настоящее время мы не индексируем их как изображения отдельно. Это может измениться в будущем, но по крайней мере на данный момент вы захотите использовать отдельные URL-адреса изображений, если хотите, чтобы эти изображения были проиндексированы в Поиске изображений.
Джон Мюллер,
2
Хотя Google использует изображения в качестве URI-кодов данных в кодировке Base64 на своей собственной выдаче, она не индексирует такие изображения на других веб-сайтах. Спасибо @dan, который указал мне на обсуждение групп Google, где Джон Мюллер объясняет эту проблему . Это также означает, что вопрос о существовании данных EXIF на таких изображениях не актуален.
Из этого объяснения становится ясно, к каким изображениям лучше применять эту технику оптимизации производительности: маленькие изображения, такие как значки, значки и кнопки, и те изображения, которые не несут никакой дополнительной ценности для контента сайта.
На другом сайте, если один должен категорически встраивать изображение с дополнительным значением контента в качестве URI данных в кодировке base64, единственная лучшая практика для предоставления метаданных изображения - это использовать разметку Schema.org, где возможно согласование данных EXIF, например, с этим вид разметки.
Еще один многообещающий вид разметки для согласования данных, имеющих вид «свойство: значение», например EXIF, в настоящий момент имеет статус предложения. Но эта статья из блога Google показывает структурированные фрагменты, которые могут быть сгенерированы предложением разметки, которое я связал выше.
Ответы:
Google не индексирует данные URI изображений для поиска изображений Google. Джон Мюллер из Google говорит об этом здесь и в комментариях ниже. Поскольку изображения URI данных не индексируются в поиске изображений Google, данные EXIF в них не имеют значения.
Вы можете убедиться, что эти изображения не проиндексированы. Я искал в Google изображения "data uri" и проверил результаты. Все изображения, которые я просматривал, были файлами изображений, а не URI в кодировке Base64. Можно подумать, что если бы Google удалось проиндексировать изображения URI данных, некоторые из них будут отображаться в результатах поиска по этому термину.
Если Google когда-либо решит проиндексировать изображения URI данных, они смогут получить данные EXIF из них. Data URI - это весь файл base64, закодированный (без пробелов и новых строк) с
data:image/png;base64,
префиксом. Любые метаданные в файле все равно будут присутствовать в версии URI с закодированными данными base64.Я использую данные URI на одном из моих сайтов. Я делаю это потому, что пользователи обычно просто просматривают одну страницу на сайте, чтобы получить всю необходимую им информацию. Включение всех строчных данных CSS, JS и изображений на странице значительно повышает производительность. Изображения все маленькие, поэтому техника работает особенно хорошо.
Мой сайт получает достаточное количество трафика из Internet Explorer 7 и более ранних версий, которые не поддерживают изображения URI данных. Поэтому я должен обслуживать их условно. У меня также есть изображения на сервере, и я выбираю обычные URL-адреса изображений или URI данных на основе
User-Agent
заголовка. Я отношусь к ботам (в том числе к Googlebot) так же, как к IE 7, то есть к изображениям я отношу HTTP-URL. Я делаю это потому, что включение данных URI изображений значительно увеличивает размер страницы. Большинству ботов не нужно загружать изображения, поэтому для них это более эффективно. Я также заметил, что Инструменты Google для веб-мастеров сообщили, что робот Googlebot сканирует мой сайт гораздо медленнее с включенными изображениями URI данных. Технически это можно было бы считать маскировкой, но это был бы способ индексации ваших изображений URI данных.источник
Хотя Google использует изображения в качестве URI-кодов данных в кодировке Base64 на своей собственной выдаче, она не индексирует такие изображения на других веб-сайтах. Спасибо @dan, который указал мне на обсуждение групп Google, где Джон Мюллер объясняет эту проблему . Это также означает, что вопрос о существовании данных EXIF на таких изображениях не актуален.
Из этого объяснения становится ясно, к каким изображениям лучше применять эту технику оптимизации производительности: маленькие изображения, такие как значки, значки и кнопки, и те изображения, которые не несут никакой дополнительной ценности для контента сайта.
На другом сайте, если один должен категорически встраивать изображение с дополнительным значением контента в качестве URI данных в кодировке base64, единственная лучшая практика для предоставления метаданных изображения - это использовать разметку Schema.org, где возможно согласование данных EXIF, например, с этим вид разметки.
Еще один многообещающий вид разметки для согласования данных, имеющих вид «свойство: значение», например EXIF, в настоящий момент имеет статус предложения. Но эта статья из блога Google показывает структурированные фрагменты, которые могут быть сгенерированы предложением разметки, которое я связал выше.
источник