Почему на некоторых веб-сайтах в конец URL-адресов добавляются «слага»? [закрыто]

111

Многие веб-сайты, в том числе и этот, добавляют в конец URL так называемые ярлыки - описательные, но, насколько я могу судить, бесполезные фрагменты текста.

Например, для этого вопроса сайт дает следующий URL:

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Но следующий URL работает точно так же:

/programming/47427/

Смысл этого текста просто в том, чтобы как-то сделать URL-адрес более удобным для пользователя, или есть другие преимущества?

Дэйв Уэбб
источник
44
Заголовки служат в качестве имени идентификатора вызывающего абонента URL. Когда вам звонят, знать имя человека не обязательно, но это помогает вам решить, хотите ли вы снимать трубку или нет. Точно так же ярлык URL-адреса помогает пользователю решить, хотят ли они щелкнуть ссылку, и придает ей некоторый внутренний контекст.
Armstrongest
4
^^ +1, но лучше было бы видеть ваш ответ как Ответ, а не как комментарий ..
Диенекес
помогает с рейтингом в результатах поиска.
Jay Smoke
stackoverflow.com/q/47427 также работает: P
Habeeb Perwad

Ответы:

166

Заголовки делают URL-адрес более удобным для пользователя, и вы знаете, чего ожидать, когда щелкаете ссылку. Поисковые системы, такие как Google, ранжируют страницы выше, если поисковое слово находится в URL.

Эспоо
источник
3
Одна из вещей, которые делают URL-адрес удобным для пользователя, - это «способность к обнаружению», то есть вы можете угадать URL-адрес просто из адресной строки. i.love.pets.com/search/cats+dogs может легко привести к i.love.pets.com/search/pug+puppies и т. д.
Сиань
12
Сиань, я слышал этот аргумент раньше, но я не думаю, что он выдерживает проверку. Кроме компьютерных фанатов, практически никто не набирает URL напрямую. Читаемость определенно важна, и я думаю, что все большее число пользователей видят URL-адреса, но когда дело доходит до «догадок», я думаю, что меньшинство крайне незначительно.
век 02
4
@eyelidlessnes - мне придется не согласиться. Хотя люди могут не вводить URL-адреса вручную, я видел доказательства того, что они их создают. Просматривая наши журналы и наши устройства мониторинга, мы видим примеры, в которых один пользовательский сеанс будет что-то делать, а затем изменять URL-адрес (о чем свидетельствует отсутствие реферера). Конечно, не все этим занимаются, но это определенно немалый объем трафика.
Джозеф Феррис,
@Xian. Да, несколько типов URL-адресов, однако, по сути, это идентификатор вызывающего абонента. Имя вызывающего абонента НЕ ОБЯЗАТЕЛЬНО, но это поможет вам решить, хотите ли вы ответить на звонок или нет. Заголовки делают URL-адрес более удобным и повышают вероятность того, что пользователь щелкнет по нему.
Armstrongest
xian, чем именно это отличается от google.com/search?q=cat+puppy? Люди, которые обнаруживают URL-адреса, скорее всего, сделают это. Я делаю это.
netrox
39

Удобство использования - одна из причин. Если вы получите эту ссылку в своем электронном письме, вы знаете, чего ожидать. SEO (поисковая оптимизация) - еще одна причина. Поисковые системы, такие как Google, будут ранжировать вашу страницу выше по ключевым словам, содержащимся в URL.

Михиль ван Остерхаут
источник
2
Как вы думаете, почему Google принял это решение? Что мотивировало это?
Майк Кларк,
Можете ли вы найти какую-либо документацию от Google, в которой прямо говорится, что они будут ранжировать страницу выше, если ключевое слово содержится в URL-адресе?
цепочка
@chainwork Нет, но поисковая система использует сотни сигналов для ранжирования страниц, и вы можете быть уверены, что URL-адрес является одним из таких сигналов.
Michiel van Oosterhout
2
Ключевые слова в URL, которые соответствуют поисковому запросу, выделены жирным шрифтом в результатах Google, что делает их более заметными для пользователей, выполняющих поиск.
цепочка
35

Недавно я изменил формат URL-адреса своего веб-сайта с:

www.mywebsite.com/index.asp?view=display&postid=100

Чтобы

www.mywebsite.com/this-is-the-title-of-the-post

и заметил, что рейтинг кликов по статье увеличился примерно на 300% после изменения. Это, безусловно, помогает пользователю решить, актуально ли то, что он думает о клике, с точки зрения целей SEO, хотя я должен сказать, что не заметил большого влияния после изменения.

Katy
источник
4
Я надеюсь, что заголовки ваших постов никогда не изменятся: многие люди ненавидят мертвые ссылки и веб-сервисы, которые их создают.
Никита Рыбак
6
Я не могу точно угадать, какую CMS или программное обеспечение для ведения блогов он использует, но для WordPress и многих подобных, изменение заголовка сообщения после того, как сообщение уже опубликовано, не меняет слаг (и именно по той причине, которую вы упомянули).
Cyde Weys
25

Я согласен с другими ответами, что любой неправильно набранный ярлык должен выполнять 301-перенаправление в надлежащую форму. Другими словами, /programming/47427/whследует перенаправить на/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls . У него есть еще одно преимущество, о котором не упоминалось: если вы не выполните перенаправление на канонический URL-адрес, окажется, что у вас почти бесконечное количество повторяющихся страниц. Google ненавидит дублированный контент.

Тем не менее, вам действительно следует заботиться только об идентификаторе контента и разрешать любой ввод для слага, пока вы перенаправляете. Зачем?

/programming/47427/why-do-some-веб-сайты добавляют ярлыки в конец URL

... К сожалению, программа электронной почты отключила конец URL! Нет проблем, потому что вы все еще можете кататься с/programming/47427

Одна большая проблема с этим подходом заключается в том, что если вы выводите слаг из заголовка вашего контента, как вы собираетесь работать с заголовками, отличными от ASCII, UTF-8?

Кори Р. Кинг
источник
1
Хороший пост, очень актуальный вопрос! +1 Что касается вашего вопроса, «как вы собираетесь бороться с не-ascii, заголовками UTF8?» Для этого есть алгоритмы, например тот, который использует WordPress. Я бы опубликовал решение PHP для этой конкретной проблемы, если бы было разрешено более 600 символов. Если вы действительно хотите знать, опубликуйте его как вопрос, и я с радостью отвечу на него;)
Матиас Биненс
1
re: «почти бесконечное количество повторяющихся страниц» - это произойдет только при наличии ссылок на неканонический URL. Если вы сохраните его единообразие на своем сайте, проблем быть не должно. Ваша теория об отключении URL-адресов довольно глупая, URL-адрес может быть отрезан где угодно, верно? Даже после 4742 года, что привело бы к другому вопросу. Пока вы придерживаетесь стандартных букв, цифр, дефисов и / или подчеркиваний в URL-адресе, это с меньшей вероятностью произойдет.
DisgruntledGoat
2
Как предположил DisgruntledGoat, Google технически не найдет дублированный контент, если кто-то не будет ссылаться на страницу с другим слагом, поэтому обманом заставляет паука Google думать, что есть дублированный контент. Так что паук возненавидит эту страницу, ребята, кстати;)
Остин Махони,
Технически вам не нужно делать 301 редирект, если вы встроили подсказку rel = "canonical" на страницу. Независимо от «почти бесконечного количества повторяющихся страниц», Google будет использовать единственный действительный канонический URL. Amazon не делает 301. Попробуйте: amazon.com/lat-thinking-stragies/dp/0470942185 Однако лучше сделать и то, и другое. Причина в том, что кто-то может опубликовать ссылку с полностью измененным ярлыком, и когда зритель читает ее, она выглядит иначе, чем контент, что сбивает с толку зрителя.
Итан
"Как вы собираетесь работать с заголовками, отличными от ASCII, и UTF8?" Вы их процентно кодируете. Тогда все современные браузеры фактически будут отображать Unicode во всей его многоязычной красоте в адресной строке, но при копировании в буфер обмена предоставят вам URL-адрес в кодировке ASCII с процентной кодировкой.
Stijn de Witt
14

Причина, по которой большинство сайтов используют это, вероятно, SEO (поисковая оптимизация). Yahoo раньше придавал разумный вес присутствию ключевого слова поиска в самом URL, и это также помогло в результатах Google.

Совсем недавно поисковые системы снизили вес, придаваемый ключевым словам в URL-адресе, вероятно, потому, что этот метод сейчас более распространен на спам-сайтах, чем законный. Ключевые слова в URL теперь имеют очень незначительное влияние на результаты поиска, если вообще влияют.

Что касается самого stackoverflow, SEO может быть мотивацией (старые привычки трудно избавиться) или просто для удобства использования.

DGentry
источник
SEO - это фактор. Но что более важно, как вы сказали, это касается удобства использования.
Armstrongest
14

По сути, это более значимое место для ресурса. Использование идентификатора совершенно верно, но это значит больше для машин, чем для людей.

Строго говоря, идентификатор не нужен, если слаг уникален, вы можете легко обеспечить уникальные слаги, поместив их в даты.

то есть:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/

В основном это использует низкую вероятность того, что два идентичных слага используются в один и тот же день. Если возникает конфликт, по общему правилу в конце заголовка добавляется счетчик, но вы редко когда-либо видите это:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/

Многие алгоритмы слагов также избавляются от таких общих слов, как «the» и «a», чтобы сделать URL-адрес коротким. Такой подход с ограниченным объемом также упрощает поиск всех ресурсов на определенный день, месяц или год - вы просто отрезаете сегменты.

Кроме того, URL-адреса stackoverflow плохи в том смысле, что они вводят дополнительный сегмент для отображения слага, что является нарушением идеи о том, что каждый сегмент должен представлять нисходящую иерархию ресурсов.

Эндрю Ингрэм
источник
11

Термин «слизняк» происходит от газетного / издательского бизнеса. Это короткое название, которое используется для обозначения истории в процессе. Люди, интересующиеся семантикой URL, начали использовать короткие сокращенные заголовки в своих URL. Это также окупается в области SEO, поскольку ключевые слова в URL-адресах повышают важность страницы.

По иронии судьбы, многие веб-сайты начали размещать полную сериализованную версию заголовков с дефисами в своих URL-адресах исключительно для целей SEO, что означает, что термин slug больше не применяется. Это также вызывает недовольство семантических пуристов, поскольку многие реализации просто добавляют эту сериализованную версию заголовка в конце своих URL-адресов.

Алан Сторм
источник
10

Замечу, что вы можете свободно менять текст. Этот URL-адрес работает так же хорошо.

/programming/47427/why-is-billpg-so-very-awesome

Billpg
источник
Это ошибка или особенность?
Jakub Šturc
4
Фактически, он гарантирует, что вы можете получить доступ к сообщению даже после того, как тема была изменена (и, следовательно, есть новый URL-адрес).
Дирк Фоллмар,
3
Однако в идеале каждый интернет-ресурс («документ») имеет только 1 URI. Таким образом, разрешение на просмотр одного и того же документа через разные URI может негативно повлиять на ваш сайт в поисковой выдаче. Это, наверное, единственное, что мне не нравится в Stack Overflow;)
Матиас Биненс
3
Вот почему существуют канонические страницы, и Stack Overflow их использует. =)
Аликс Аксель
4
@Alix Axel: 301 перенаправляет >канонические страницы
Матиас Байненс,
6

Как уже говорилось, «слаг» помогает людям и поисковым системам ...

Стоит обратить внимание на то, что в источнике страницы есть канонический URL

Это предотвращает многократное индексирование страницы.

Пример:

<link rel="canonical" href="http://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls">
Robs
источник
3

Не забывайте о удобочитаемости при отправке ссылки не только в поисковых системах. Если вы отправите кому-то по электронной почте первую ссылку, они могут посмотреть URL-адрес и получить общее представление о том, о чем идет речь. Второй не указывает на содержание этой страницы до того, как они нажмут.

Крис Бартоу
источник
2

Если вы отправили кому-то ссылку по электронной почте, не было бы более разумным включить описание, фактически выписав описание, вместо того, чтобы заставить другого человека выполнить синтаксический анализ URL-адреса, в котором существует описание, и попытаться прочитать кучу -слепленные-слова-с дефисами.

Kibbee
источник
Очевидно, ты никогда не был Риком Роллдом, не так ли. Сколько ссылок вы получите: Проверьте это. Веселое! <ссылка>. Было бы неплохо, если бы Youtube делал URL-адреса так: youtube.com/12345/evil-bikini-wax-job-not-work-safe. Это сделало бы ссылки более надежными и помогло бы мне принять решение, нажимать или нет.
Armstrongest
1
Однако любая система MVC, которую я видел, не требует дополнительной части злой-бикини-воск-работа-не-безопасная работа, и ее можно так же легко отправить, как youtube.com/12345, и большинству людей кто хотел рассылать подобные вещи, быстро научился их удалять.
Kibbee
2

Во-первых, это SEO и удобство для пользователя, но в случае примера (этот сайт) это сделано не так хорошо или правильно (поскольку он открыт для трюков с черной шляпой и отравления рангов другими, что плохо отразится на этом сайте) .

Если

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

имеет содержание, тогда

/programming/47427/

и

/programming/47427/any-other-bollix

не должно быть дубликатов. На самом деле они должны автоматически определять, по какой ссылке используется текущий текст (очевидно, что слаг определяется заголовком вопроса и может быть позже отредактирован), и они должны автоматически перенаправить 301 на

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

таким образом обеспечивается правило «один фрагмент контента на один URI», и если URI перемещается / изменяется, убедитесь, что старые закладки следуют / перемещаются вместе с ним через 301 редирект (чтобы интеллектуальные браузеры могли обновлять закладки).

Алан Доэрти
источник
1
Просмотрите исходный код страницы, и вы найдете это: <link rel = "canonical" href = " stackoverflow.com/questions/47427/… "> См .: здесь: googlewebmastercentral.blogspot.com/2009/02/…
Armstrongest
0

В идеале «слизняк» должен быть единственным необходимым идентификатором. На практике, на таких динамических сайтах, как этот, вы должны либо иметь уникальный числовой идентификатор, либо начинать добавлять / увеличивать числа к «слагу», как это делает Digg.

Кайл Кронин
источник
1
Ссылка Digg была первой, на которую я наткнулся, когда спускался вниз по главной странице. Это чистое совпадение, что это также является примером того, как далеко продвинулся Digg - история о сексуальной зависимости публиковалась трижды.
Кайл Кронин,