Должен ли я использовать расширение файла или нет?

26

Я всегда задавался вопросом об этом и никогда не находил хорошего решения.

Но этот вопрос напомнил мне об этом.

Когда у меня есть URL на моем веб-сайте, он может быть отображен и доступен любым из следующих способов:

http://www.somesite.com/subdirectory
http://www.somesite.com/subdirectory/
http://www.somesite.com/subdirectory/index.htm
http://www.somesite.com/subdirectory/index.html
http://www.somesite.com/subdirectory/index.php
http://www.somesite.com/subdirectory/index.asp
http://www.somesite.com/subdirectory/some-relevant-keywords
http://www.somesite.com/subdirectory/some-relevant-keywords.htm
http://www.somesite.com/subdirectory/index.php?page=some-relevant-keywords
http://www.somesite.com/subdirectory/?page=some-relevant-keywords
http://www.somesite.com/subdirectory/?page=some-relevant-keywords&even=more-keywords

так далее...

Теперь я могу понять достоинства добавления ключевых слов в URL. Даже самое простое руководство по SEO будет упоминать именно это. ... но ради здравомыслия, ясности, удобства чтения, удобства использования и т. д., включая соответствие веб-требованиям ...

Является ли он предпочел иметь расширение файла или нет?

Действительно, в глубине души моя логика говорит мне: да, так и должно быть. Причина в том, что это восходит к прошлым временам, когда Интернет был в основном USENET, FIDONET, FTP и GOPHER.

Смотрите, если у URL нет имени файла , то он обычно считается каталогом . Именно здесь возник файл index.htm, поскольку по умолчанию в нем указывается каталог, если индексный файл не найден. Однако довольно скоро веб-программисты начали переопределять это и использовать index.htm, чтобы фактически обслуживать содержимое этого веб-каталога как страницу . Основным отличием было добавление языка разметки, и это было проанализировано в браузере. С этим языком разметки Content-Type:text/html;тег в заголовке ответа стал индикатором того, какой тип файла был для любого файла . Кажется, что HTML является единственным «типом файла», который не имеет последовательно именованных расширений, за исключением случаев, когда они сохраняются.

К сожалению, как только веб-страницы стали главными, это стало ошибкой безопасности, чтобы фактически отобразить содержимое каталога, поэтому все оставалось скрытым, при этом отображался только фактический контент URL.

Не говоря уже о кросс-платформенных войнах имен файлов. Для Windows требуется расширение из 3 или менее цифр, а у unix / mac может быть больше. Так должно быть .HTMили .HTMLили NONEи пусть платформа решит?

Так что, по сути, я думаю, что я пытаюсь понять, что выходит за рамки SEO и больше касается эстетики и соответствия веб-требованиям.

Талви Ватиа
источник
Как бы вы это настроили? В вашем файле .htaccess? Я имею в виду, изменить путь для .html-файла, чтобы он выглядел как первый пример?
Zolomon
1
@zolomon вы можете сделать это, или еще лучше использовать динамический анализатор URI, как это делает Wordpress, и перенаправить *.*на него.
Талви Вати

Ответы:

20

Используйте .extension, если существует более одного представления или если клиентское программное обеспечение абсолютно глупо и отказывается принимать только Content-Type (QuickTime, RealPlayer, Outlook и т. Д. Я смотрю на вас):

  • http://www.somesite.com/subdirectory - это может быть ваша версия с автоматическим согласованием, в которой используются мета-теги Canonical для указания фактического представления

  • http://www.somesite.com/subdirectory/ - всегда стоит поддерживать косые черты на любом URL, но использовать мета-теги Canonical (не перенаправлять, поскольку это является ненужным замедлением), чтобы указывать на правильный URL

  • http://www.somesite.com/subdirectory/index.htmи http://www.somesite.com/subdirectory/some-relevant-keywords.htm- ограничение расширения в три символа не применяется к HTTP (только базовая FileSystem / OS), поэтому клиент может сохранить его как index.html или aa, если хочет, при этом все еще имея возможность доступа к нему

  • http://www.somesite.com/subdirectory/index.html - если вы используете .atom, .xml или аналогичную версию, то имеет смысл также учитывать версию .html (и канонически ссылаться на нее через теги LINK на версии с автоматическим согласованием) - использовать заголовки HTTP Content-Location для указания к версии с автоматическим согласованием - помните, что вы также можете перейти на многоязычный (.en, .es и т. д.) или на несколько кодировок (.utf8, .utf16 и т. д.)

  • http://www.somesite.com/subdirectory/index.phpи http://www.somesite.com/subdirectory/index.asp- если вы не обслуживаете исходный код, поддерживать их бессмысленно

  • http://www.somesite.com/subdirectory/some-relevant-keywords - SEO - это постоянно меняющееся искусство, и если это работает для вас, тогда отлично

  • http://www.somesite.com/subdirectory/index.php?page=some-relevant-keywords, http://www.somesite.com/subdirectory/?page=some-relevant-keywordsИ http://www.somesite.com/subdirectory/?page=some-relevant-keywords&even=more-keywords- если есть бесконечное число способов манипулировать содержание , то это здорово - но обычно страницы заслуживают их собственный URL не строка запроса и их тип URL , которые следует избегать (попытаться получить кто - то компьютерно неграмотный типа один из те, в)

Metalshark
источник
1
Многоязычное расширение? Это первый раз, когда я вижу что-то подобное. Я помню, как читал, что Google предпочитает папки, /es/subdirectory/index.htmlдаже больше, чем поддоменов http://es.example.com/subdirectory/index.html. У вас есть информация о том, насколько хорошо расширение .es поддерживается поисковыми системами? Потому что я бы с удовольствием это использовал. (Также вы могли бы объединить их? Как /index.utf16.es?)
Тимо Хуовинен
13

Я бы сказал , не включайте расширение файла, если программное обеспечение, которое вы используете, позволяет вам его опустить. Итак, из вашего списка примеров я бы предпочел:

http://www.somesite.com/subdirectory/some-relevant-keywords

Браузеры не заботятся о том, является ли что-то каталогом или нет на сайте, или это HTML-файл, ASP-файл или что-то еще - они просто делают HTTP-запрос и получают HTTP-ответ. Так что если расширение лишнее, отбросьте его.

Это также дает дополнительное преимущество, заключающееся в том, что ваши URL-адреса становятся более лаконичными (и их легче читать по телефону - «пример dot com slash products» звучит гораздо приятнее, чем «example dot com slash products dot htm l») и упрощает его. для переключения технологий в будущем (так как изменение URL не потребуется).

Тим Фонтан
источник
4
Я склоняюсь к этому как лучшему опыту, из-за SEO и эстетических причин.
Талви Ватиа
Да, браузерам все равно, но серверам все равно, будет ли это asp, aspx или какой-то другой тип, который потребует дополнительной обработки на веб-сервере.
благоговение
Возвращаясь к этому после многих лет, наилучшая практика, похоже, возобладала. Тем не менее, мне все еще интересно, что произойдет, когда логика веб-сканера в конечном итоге научится анализировать операнды. Например, some-relevant-keywordsон эквивалентен тому, что (some) (!exclude->relevant) (!exclude->keywords)заставляет каждого SEO-эксперта внезапно изменить его на some+relevant+keywordsуничтожение эстетики и читабельности использования дефисов в качестве символов-разделителей. Основная причина: /?query=some-relevant-keywordsэто уже буквальное исключение.
Талви Вати
8

Желательно ли иметь расширение файла или нет?

В RFC нет ничего, чтобы предписывать наличие расширений файлов, и нет ничего, что требовало бы от вас их исключать. Это выбор, который вы делаете.

Соответствующие HTTP URI не нуждаются ни в каких расширениях файлов. Существует богатый набор заголовков HTTP (особенно MIME-типа) для обработки всего, для чего в противном случае используются расширения файлов.

При этом большинство современных браузеров фактически используют комбинацию типа MIME, расширения и двоичного «отпечатка пальца» первых байтов для определения типа контента. Иногда это может давать неожиданные результаты , и поэтому важно, чтобы мы, веб-мастера, установили правильные заголовки (и, возможно, отключили анализ типа контента, если мы на 101% уверены, что наши заголовки верны).

Существует одна ситуация, когда расширения файлов полезны: если конечный пользователь сохраняет контент с вашего сайта на свой локальный компьютер для дальнейшего использования. Теоретически «умный» браузер должен гарантировать, что сохраненный контент работает для локального типа компьютера; но на практике вы можете помочь всем, предоставляя контент с помощью стандартных расширений, таких как .jpg, .mp4, .css и т. д. По моему опыту, все браузеры правильно обрабатывают тип HTML. Вам не нужно самостоятельно добавлять расширение .htm / .html в HTML, браузер будет правильно обрабатывать этот конкретный тип контента.

Безопасность: Кто-то может поспорить, что безопасность скрывает скрытую платформу, которую вы используете (.php / .asp и т.д.). Это правда. На практике, я думаю, что любой хороший хакер узнает об этом сразу, поэтому я не думаю, что сокрытие этих расширений для обеспечения безопасности стоит потраченных усилий.

Особое внимание: если вы планируете использовать CDN в будущем, и ваш CDN имеет тип «push» (контент загружается в CDN заранее через fx через SFTP), то вы можете сохранить расширения файлов. Большинство сторонних систем обращаются к расширениям файлов, чтобы определить, к какому типу MIME относится контент.

Мой личный выбор стал:

  • Когда мой веб-приложение динамически генерирует HTML, я не добавляю поддельное расширение .html для имитации структуры каталогов и файлов, которой на самом деле нет. Я нормализую URL-адреса и стандартизирую формат URL-адреса, используемый по причинам SEO. Лично я предпочитаю использовать косую черту на последнем листе URL-адреса, т.е. http://example.org/first/second/, но это дело вкуса.

  • Когда мы на самом деле говорим о реальных файлах, которые загружаются на жесткий диск, то я сохраняю «нормальное» расширение файла для этого типа. Так что .css / .js / .exe / .mp4 и т. Д. Используются для такого рода контента.

Джеспер М
источник
.htmВо- первых, добавление для имитации каталога (а не переопределение index.htm) на самом деле не «фальшивка», поскольку вы обслуживаете контент HTML. Было бы подделкой, если бы контент не был HTML.
Талви Ватиа
2

Я провел небольшие неформальные эксперименты, и то, что я обнаружил, удивило меня, но в этом есть смысл.

С точки зрения доставки контента пользователю, а также соскоба с экрана, Тип контента управляет днем.

Тем не менее, наличие или отсутствие расширения, а также то, что это расширение, похоже, влияет на посещения поисковой системы.

Когда я вообще пропустил какое-либо расширение, у меня было относительно мало обращений - как если бы URL был местоположением или динамическим контентом и поэтому не стоил слишком много индексировать.

Когда я изменил те же ссылки, чтобы использовать расширение .xml, поскольку страницы были действительно сгенерированы XSLT (на стороне сервера), индексирование фактически упало еще больше - возможно, потому, что он думал, что это были просто данные или результат какого-то программного запроса ,

Когда я изменил те же ссылки, чтобы использовать .html, поисковые системы взбесились с сайта.

На данный момент мой сайт обрабатывает все три прозрачно, но когда он предоставляет ссылку, по которой можно кликнуть, я возвращаю .html версию URL.

Я хотел бы думать, что поисковые системы были немного умнее или менее предвзятыми, но это то, что я наблюдал, случалось с моими страницами.

Уолт Стоунбернер
источник
не будет ли иметь несколько URI для одного и того же ресурса, что приведет к дублированию страниц?
Талви Ватиа
Технически, я полагаю, что так, и я подозреваю, что тогда нужно сделать, чтобы другие просто выполнили перенаправление.
Уолт Стоунбернер
это действительно очень удивительно! Можете ли вы предоставить дополнительную информацию, например, какие поисковые системы, в какой степени вы заметили это изменение и т. д.?
damusnet
Я сильно потерял трафик, и хотя я до сих пор не уверен, я думаю, что это совпало с моментом, когда я переключился с rel canonical с .html на один без.
Дан
К сожалению ответить так поздно, но я помню , некоторое время назад Мэтт Каттс упоминая использовать .html , если это возможно. ( подробнее здесь ). В некотором смысле имеет смысл, что поисковые системы чувствительны к расширениям, просто представьте, что видитеhttp://example.com/index.exe
Тимо Хуовинен,
2

Нет, вы не должны использовать расширение файла для обычных типов страниц, если вам это абсолютно не нужно по технической причине. Как это улучшает пользовательский опыт? Это больше, чтобы напечатать, но это не говорит им ничего полезного. Что они смогут сделать, зная, что ваш сайт PHP, ASP и т. Д.? URL проще, понятнее, удобнее в использовании и более запоминающимся без расширения файла.

Смотрите, если у URL нет имени файла, то он обычно считается каталогом.

Я не думаю, что я согласен. Как правило, URL является каталогом, только если он имеет косую черту. Без косой черты он считается файлом.

Виртуозы Медиа
источник
Опыт пользователя: если расширение файла .phpили .aspесли пользователь его сохраняет, это будет неизвестный тип файла, и компьютерные неграмотные могут не знать, как открыть его заново. Без типа файла браузер добавил бы его, но, возможно, это мешает некоторым поисковым системам?
Талви Ватиа
0

Вам следует только добавить расширение файла, если содержимое URI на самом деле является файлом. Но даже тогда вы можете оставить его, если есть только одно его представление (JPG, PDF, ...).

Если существует несколько представлений, HTTP-способ будет заключаться в согласовании формата через Acceptзаголовок. Но если вы хотите, чтобы ваши пользователи имели право голоса, вы, вероятно, захотите иметь расширение, чтобы они могли выбирать, какое представление они хотят (JPG, PNG, ...), запрашивая тот или иной URI.

DanMan
источник
Это больше, чем просто изображение или другие ресурсы. Для не HTML-ресурсов, я бы всегда использовал расширение файла. Большинство браузеров не будут знать, что делать, если его не использовать, если пользователь делает «сохранить как». Конечно, вы можете добавить тип файла в заголовок, но однажды сохраненные клиентские компьютеры не будут знать, как открыть файл заново.
Талви Ватиа