Что добавляет символы лягушки в мои URL?

8

Просматривая раздел «Ошибки сканирования» Инструментов Google для веб-мастеров, я обнаружил ряд очень странных 500 ошибок, связанных с моим сайтом:

Лягушачьи URL

Мне удалось отследить, что это за символы, и, по-видимому, они являются первыми двумя персонажами в области личного использования Unicode . Мой шрифт как раз случайно отобразил их на лягушку с крошечной короной и символом, который напоминает цифру 7.

Эти символы появляются только на адресах не-HTML файлов; офисные документы, PDF-файлы и т. д. - но они не просто появляются в имени файла.

Откуда берутся эти символы и могу ли я от них избавиться, чтобы Google мог правильно сканировать мой сайт?

Некоторая справочная информация:

  • Использование веб-сервера под управлением WS2K3 с IIS6 и PHP 5.3.8
  • Кодировка сайта - UTF-8
  • Эти символы не появляются ни на странице, ни в источнике
Джейкоб Хьюм
источник
6
Теперь есть то, что вы не видите каждый день.
Джон Конде
@ Джон Конде: Расскажи мне об этом. Это не проблема утра понедельника. : P
Джейкоб Хьюм
они появляются на всех не HTML-файлах или только на некоторых?
froderik
@froderik Лишь немногие и затронутые документы были размещены разными разработчиками в разных разделах веб-сайта.
Джейкоб Хьюм

Ответы:

4

Это всего лишь предположение, но одна возможность состоит в том, что кто-то другой ссылается на ваши файлы с неработающим кодом. Я знаю, что всякий раз, когда у меня возникали хитрые запросы на мои сайты, я всегда мог отследить их до чужой ссылки. (Действительно раздражает, что у пауков нет заголовков Http-Referer, чтобы нам было легче идентифицировать источник этих URL).

Питер Тейлор
источник
1
«... пауки не включают заголовки Http-Referer ...» - Да, но Инструменты Google для веб-мастеров действительно включают отчеты, в которых (как правило) указывается, какие сайты ссылаются на рассматриваемый контент.
danlefree
Я быстро проверил разделы «Ссылки на ваш сайт» и «Внутренние ссылки» Инструментов для веб-мастеров и не увидел ни одного символа в 1000 отображаемых ими ссылок. Отличная идея!
Джейкоб Хьюм