В моем проекте мне нужно добавить возраст кэша Google в качестве важной информации. Я пытался найти в источниках возраст кэша Google, то есть количество дней, прошедших с того момента, когда Google последний раз переиндексировал указанную страницу.
Где я могу получить возраст кэша Google?
html
url
hyperlink
web-scraping
Токендра Кумар Саху
источник
источник
Ответы:
Используйте URL
Пример:
Он содержит такой заголовок:
источник
robots.txt
; Я использую его для чтения блогов, так как наш корпоративный брандмауэр отключил его URLcache:
оператор поиска в поиске Googlehttps
этого требуетсяhttps://
часть, иначе возвращается 404Вам нужно будет очистить полученную страницу, но вы можете просмотреть самую последнюю страницу кэша, используя этот URL :
Информация Google помещается в первый div в теге body.
источник
Вы можете использовать веб-сайт CachedPages
Кэшированные страницы обычно сохраняются и хранятся крупными компаниями с мощными веб-серверами. Поскольку такие серверы обычно работают очень быстро, доступ к кэшированной странице часто может быть быстрее, чем к самой живой странице:
источник
это слишком просто, вы можете просто набрать «cache:» перед URL страницы. например, если вы хотите проверить последний веб-кеш этой страницы, просто введите в строку URL
cache:http://stackoverflow.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page
это покажет вам последний веб-кеш страницы. см. здесь:
Но помните, что кэширование веб-страницы будет отображаться только в том случае, если страница уже проиндексирована в поисковой системе (Google). для этого вам нужно проверить метатег тега этой страницы.
источник
Вы можете использовать этот сайт: https://cachedviews.com/ . Просмотр кэша или кэшированных страниц любого веб-сайта - Google Cached Pages любого веб-сайта
источник
Это хорошо также для просмотра кеш-страницы http://www.cachepage.net
Кэширование просмотра страниц через Google: webcache.googleusercontent.com/search?q=cache: Ваш URL
Кэширование просмотра страницы через archive.org: web.archive.org/web/*/Your url
источник