Я использовал Wget и столкнулся с проблемой. У меня есть сайт, на котором есть несколько папок и подпапок. Мне нужно скачать все содержимое в каждой папке и подпапке. Я пробовал несколько методов, используя Wget, и когда я проверяю завершение, все, что я вижу в папках, это «индексный» файл. Я могу нажать на индексный файл, и он приведет меня к файлам, но мне нужны сами файлы.
у кого-нибудь есть команда для Wget, которую я пропустил, или есть другая программа, которую я мог бы использовать, чтобы получить всю эту информацию?
пример сайта:
www.mysite.com/Pictures/ в папке Pictures DIr есть несколько папок .....
www.mysite.com/Pictures/Accounting/
www.mysite.com/Pictures/Managers/Северная Америка / Калифорния / JoeUser.jpg
Мне нужны все файлы, папки и т.д .....
wget
, в частности, для ее рекурсивного использования ?Ответы:
Я хочу предположить, что вы не пробовали это:
или для извлечения контента, не загружая файлы «index.html»:
Справка: Использование wget для рекурсивного извлечения каталога с произвольными файлами в нем
источник
я использую
wget -rkpN -e robots=off http://www.example.com/
-r
значит рекурсивно-k
означает конвертировать ссылки. Так что ссылки на веб-странице будут localhost вместо example.com/bla-p
означает получить все ресурсы веб-страницы, поэтому получите изображения и файлы javascript для правильной работы сайта.-N
для получения меток времени, поэтому, если локальные файлы новее, чем файлы на удаленном веб-сайте, пропустите их.-e
это опция флага, она должна быть там дляrobots=off
работы.robots=off
означает игнорировать файл роботов.У меня также было
-c
в этой команде, так что если они потеряли соединение, продолжили бы с того места, где оно было прервано, когда я перезапущу команду. Я подумал,-N
что будет хорошо с-c
источник
-e
выполнит команду, как если бы она была частью .wgetrc. Я добавил ее туда, так какrobots=off
там, похоже, не получилось.wget -m -A * -pk -e robots = off www.mysite.com/ это будет загружать все типы файлов локально и указывать на них из файла html,
а также игнорировать файл роботов
источник