Мне нужно скопировать сайт через HTTP. Мне нужно загрузить изображения, HTML, CSS и JavaScript, а также организовать их в файловой системе.
Кто-нибудь знает как это сделать?
html
javascript
css
ripping
Дэймон
источник
источник
Ответы:
Это работает в консоли.
это захватит сайт, подождет 3 секунды между запросами, ограничит скорость его загрузки, чтобы он не убивал сайт, и замаскирует себя так, чтобы он выглядел просто как браузер, чтобы сайт не отрезал вас используя механизм против пиявки.
Обратите внимание на
-A
параметр, который указывает список типов файлов, которые вы хотите загрузить.Вы также можете использовать другой тег,
-D domain1.com,domain2.com
чтобы указать серию доменов, которые вы хотите загрузить, если у них есть другой сервер или что-то еще для размещения файлов разных типов. Там нет безопасного способа автоматизировать это для всех случаев, если вы не получаете файлы.wget
обычно предустановлен в Linux, но может быть легко скомпилирован для других систем Unix или легко загружен для Windows: GNUwin32 WGETИспользуйте это для добра, а не зла.
источник
Хорошее бесплатное решение: HTTrack
источник
В системах Linux, wget делает это, в значительной степени.
Его также перенесли на несколько других платформ, как упоминалось в нескольких других ответах.
источник
Очевидно, WGet упоминался несколько раз. Лучший пользовательский интерфейс, который я нашел для этого
Существуют и другие интерфейсы для WGet, некоторые из которых являются кандидатами на худший вопрос.
источник
Посмотрите на расширение Scrapbook для Firefox. Он отлично справляется с этой задачей, а также интегрируется с firebug и позволяет вам удалять элементы из DOM перед сохранением, если хотите.
источник
Вам нужно использовать wget - который доступен для большинства платформ. curl не будет запрашивать документы рекурсивно, что является одной из основных сильных сторон wget.
Linux: (обычно входит в дистрибутив) http://www.gnu.org/software/wget/
Windows: http://gnuwin32.sourceforge.net/packages/wget.htm
Mac: http: //www.geekology. co.za/blog/2009/02/macports-compile-and-install-open-source-software-on-mac-os-x/
ПОЖАЛУЙСТА, убедитесь, что вы не забиваете сайт - установите подходящие задержки между запросами и убедитесь, что он соответствует условиям обслуживания сайта.
-Адам
источник
На самом деле, после моего комментария в посте GWLlosa, я только что вспомнил, что у меня установлен GnuWin32, и, конечно же, он содержит Windows-порт wget.
http://sourceforge.net/projects/gnuwin32/
источник
Я использовал это несколько лет назад, и это сработало хорошо. Только для Windows Раньше был рекламным, но больше не видимо:
http://www.webreaper.net/
источник
wget --random-wait -r -p -e robots=off -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" --limit-rate=20k -b http://www.example.com
источник
-c
(или--continue
) параметр, когда что-то идет не так, и мне нужно перезапустить процесс.Я думаю, IDB граббер - это лучшее решение, есть и Teleport pro
источник
Free Download Manager может также загружать целые сайты.
Windows только я думаю.
источник