Существует ли портативный способ загрузки или кэширования всех страниц веб-сайта для просмотра в автономном режиме? Завтра у меня полет по стране, и я хотел бы иметь возможность кэшировать несколько веб-страниц (в частности, страницу документации Python ( http://docs.python.org/ ) и ссылку на Pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).
В идеале я хотел бы добавить дополнение к Firefox или что-то в этом роде, но все будет хорошо, если я смогу запустить его в Linux.
Ответы:
Я использую HTTrack .
источник
Я использую wget с этими параметрами для зеркалирования сайта для автономного использования.
где
-m включает параметры зеркалирования для локального зеркалирования сайта
-c продолжает предыдущую загрузку в случае, если я уже загрузил некоторые страницы
-k преобразует абсолютные значения href в локальные для просмотра в автономном режиме
-E гарантирует, что файлы имеют расширение .html после загрузки.
-np загружает только объекты в / a / section / i / и не кэширует весь сайт.
Например, я хотел скачать южную документацию, но не южные билеты и т.д ...
Я использую Windows и запускаю wget на cygwin, но есть также и собственный порт wget для Windows .
Хотя, в вашем случае, вы можете скачать Python автономные документы из раздела Python Docs
источник
Попробуйте http://www.downthemall.net/ плагин Firefox. Я использовал его для загрузки 250 страниц PDF-файлов в более чем 20 отдельных файлах. Это очень мощный. Он имеет подстановочный / синтаксис запроса, который позволяет хирургическим путем получать только те файлы, которые вы хотите, и ни один из ненужных, которые вы не делаете.
источник
Некоторые расширения Firefox, о которых я знаю:
ScrapBook
ScrapBook Plus
UnMHT
Pocket (не расширение; встроенная функция Firefox)
Обратите внимание, что:
источник
Вы можете скачать весь сайт или часть сайта с помощью wget.
Посмотрите в руководстве по wget другие параметры, которые вы, возможно, захотите передать, например, чтобы ограничить использование полосы пропускания, контролировать глубину рекурсии, настроить списки исключений и т. Д.
Другой подход к просмотру в автономном режиме - использование кэширующего прокси. Wwwoffle - это та, которая обладает множеством функций, облегчающих сохранение для просмотра в автономном режиме, таких как переопределение даты истечения срока, указанного сервером, и возможность рекурсивной предварительной выборки. (Я пользуюсь wwwoffle с моего модемного времени.)
источник