Как влияет лигатура в сети на SEO?

19

Все дизайнеры любят лигатуры, но ванильная веб-типография просто отстой. Я слышал о умных брюках, которые решают многие из этих проблем, принося сексуальные цитаты, великолепные амперсанды и все такое. Это просто идеально, визуально.

Но я беспокоюсь о SEO. Допустим, на веб-странице слово finallyстановится finally. Способны ли поисковые системы индексировать это слово и возвращать страницу при поиске finally(без лигатуры)?

TKrugg
источник

Ответы:

3

Резюме

Если ваш сервер распределяет страницы с помощью лигатур (как это делают smartypants), поисковые системы несовместимы. Bing в настоящее время не индексирует лигатуры правильно. Я бы сказал, в общем, это напрашивается на неприятности. Поскольку поисковые системы меняются, ниже представлен метод, который вы можете использовать для проверки того, насколько поисковые системы интересуются лигатурами индексов .

Если ваш сервер распределяет страницы обычным текстом, то Javascript превращает их в лигатуры, это нормально . Поисковые системы не применяют изменения содержимого Javascript перед индексацией страниц (хотя утверждается, что есть несколько исключений, таких как загрузка комментариев Facebook ). Поскольку существует стандартный отраслевой метод предоставления поисковым системам динамического контента, и этот метод одобрен Google , было бы большим сюрпризом, если это изменится в будущем. Google советует просматривать ваш сайт с помощью обычного текстового браузера (например, они предлагают Lynx ), чтобы увидеть ваш контент так, как его видит поисковая система.


Подробнее о первом случае (страницы выделены лигатурами в коде) ...


Теоретически

... это не должно иметь никакого значения для хорошо настроенной поисковой системы.

Сначала это помогает понять разницу между глифами и символами . Лигатура - это один глиф, обозначающий два символа f i. То, как программное обеспечение обрабатывает его, зависит от этого программного обеспечения и зависит от контекста и поставленной задачи - из примеров в этом связанном вопросе вы увидите, что при копировании и вставке глифов то, что вставляется, будет различным: иногда вставляется глиф, иногда глиф обрабатывается как связанные с ним символы и fи iвставляются.

Любой хорошо сделанный автоматический текстовый процессор, который интересуется семантикой текста (поисковые системы, проверка орфографии, программы чтения с экрана ...), должен рассматривать глиф как идентичный символам, которые он обозначает, и должен обрабатываться finallyкак идентичный finally, потому что это текстовое смысл глифа.

На практике

Не все хорошо сделано ...

Вот простой способ проверить поисковые системы. Вот строка текста из этого другого вопроса:

Copy the ligature fi from Illustrator to this input box

Если мы возьмем не лигатурную версию этого предложения и поищем его в двойных кавычках:

(поиск "Copy the ligature fi from Illustrator to this input box"):

  1. ... если поисковая система рассматривает лигатурные глифы как совпадения с символами, которые они представляют, она найдет эту страницу (и, когда она проиндексирована, эту)
  2. ... если поисковая система рассматривает лигатурные глифы как отличающиеся от символов, которые они представляют, она не найдет ничего, пока эта страница не будет проиндексирована, тогда она найдет только эту страницу, и поиск с версией лигатуры найдет эту страницу.
  3. ... если поисковая система сходит с ума при виде символов, подобных лигатурам, она ничего не найдет, даже эта страница, и поиск с версией лигатуры также ничего не найдет

Некоторые быстрые результаты для 5 лучших поисковых систем в мире (ссылки на результаты поиска):

  • Google: Хорошо (тип 1) . (несмотря на комментарий ниже, он отлично справляется как с форматированием юникода, так и с HTML-форматированием)
  • Bing: Fail ( тип 2 ).
  • Yahoo: Fail ( тип 2 ) (оказывается, что Yahoo "Powered by Bing")
  • Яндекс (русский): Хорошо (тип 1)
  • Baidu (китайский): эээ, никаких страниц graphicdesign.stackexchange.com, похоже, вообще не появляется в поисках Baidu ... может, нас там забанят ...?!
user56reinstatemonica8
источник
Нет, я только что отредактировал свой ответ, посмотрите исходный код по этой ссылке. Все в юникоде, как & # xfb00; который алгоритм Google игнорирует.
Райан
На самом деле Google соответствует этим: посмотрите на то, что он выделяет здесь (лигатуры) и здесь (простой текст) - оба соответствуют обоим. Но я согласен с вашим советом ...
user56reinstatemonica8
... (эти URL были массивными, нужно 2 комментария), это похоже на неприятности. Если bing не соответствует лигатурам, другие важные сервисы тоже не будут.
user56reinstatemonica8
Посмотрите URL первой ссылки и соответствующий ей исходный код: вы увидите, что у Google (в настоящее время ...) нет проблем с форматированием юникода, и он индексирует юникодные лигатуры, лигатуры сущностей HTML и обычные отдельные пары символов вроде f iкак без проблем. Google, кажется, справляется хорошо - но несоответствие между различными поисковыми системами является (по крайней мере, в моей книге) нарушителем.
user56reinstatemonica8
3

Основываясь на одном живом примере, который я видел, я был бы чрезвычайно обеспокоен широким использованием этого, потому что это повлияет на SEO. Специальные символы анализируются как Unicode, поэтому алгоритм Google не будет их читать. Это должно быть хорошо для щадящего использования, но я бы не стал сходить с ума или использовать его для чего-то важного, например, для заголовка.

Вот ссылка на живой пример, который я посмотрел: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Райан
источник
Я не думаю, что они будут теми буквами в исходном коде. Похоже, что smartypants - это серверная вещь, которая анализирует ввод и сохраняет глифы в тексте, хранящемся в базе данных, а следовательно, и в исходном коде. Тем не менее, я думаю, что это будет хорошо для SEO в любом случае.
user56reinstatemonica8
А на самом деле я проверял элемент, но на самом деле не просматривал источник. Я отредактирую свой ответ.
Райан
1
Я определенно согласен с «крайне обеспокоенным», поддержка юникода общеизвестно непоследовательна. Но для записи Google может (в настоящее время ...) индексировать Unicode и сопоставляет (в настоящее время ...) эти лигатуры Unicode на этой странице с поиском и l i f iт. Д. (См., Как это выделяет их жирным шрифтом в предварительном просмотре). Но я определенно не хотел бы полагаться на это ...
user56reinstatemonica8
Что делать, если лигатуры были размещены через JavaScript? Это не изменит HTML-документ, следовательно, будет полностью невидимым для поисковых систем? Это будет решением?
TKrugg
Да, это должно быть хорошо - поисковые системы обычно индексируют оригинальный документ без применения JavaScript. Вы, вероятно, захотите убедиться, что это не замедляет время загрузки страницы и что для зрителя нет резкого толчка, когда ванильные символы заменяются лигатурами во время загрузки страницы.
user56reinstatemonica8