Просматривая раздел «Ошибки сканирования» Инструментов Google для веб-мастеров, я обнаружил ряд очень странных 500 ошибок, связанных с моим сайтом:
Мне удалось отследить, что это за символы, и, по-видимому, они являются первыми двумя персонажами в области личного использования Unicode . Мой шрифт как раз случайно отобразил их на лягушку с крошечной короной и символом, который напоминает цифру 7.
Эти символы появляются только на адресах не-HTML файлов; офисные документы, PDF-файлы и т. д. - но они не просто появляются в имени файла.
Откуда берутся эти символы и могу ли я от них избавиться, чтобы Google мог правильно сканировать мой сайт?
Некоторая справочная информация:
- Использование веб-сервера под управлением WS2K3 с IIS6 и PHP 5.3.8
- Кодировка сайта - UTF-8
- Эти символы не появляются ни на странице, ни в источнике
google-search-console
http-code-500
unicode
Джейкоб Хьюм
источник
источник
Ответы:
Это всего лишь предположение, но одна возможность состоит в том, что кто-то другой ссылается на ваши файлы с неработающим кодом. Я знаю, что всякий раз, когда у меня возникали хитрые запросы на мои сайты, я всегда мог отследить их до чужой ссылки. (Действительно раздражает, что у пауков нет заголовков Http-Referer, чтобы нам было легче идентифицировать источник этих URL).
источник