Рекурсивный эквивалент загрузки (`wget -r`) для Firefox?

15

У меня есть веб-сайт, и я хочу загрузить все страницы / ссылки на этом веб-сайте. Я хочу сделать wget -rпо этому URL. Ни одна из ссылок не выходит за пределы этого конкретного каталога, поэтому я не беспокоюсь о загрузке всего Интернета.

Оказывается, нужные мне страницы находятся за защищенным паролем разделом сайта. Хотя я мог бы использовать wget для ручного согласования файлов cookie, мне было бы намного проще просто «войти» из браузера и использовать какой-нибудь плагин firefox для рекурсивной загрузки всего.

Есть расширение или что-то, что позволит мне сделать это? Многие расширения фокусируются на получении медиа / картинок со страницы (хе-хе-хе), но меня интересует весь контент - HTML и все.

Предложения?

Благодарность!

редактировать

DownThemAll кажется классным предложением. Может ли это сделать рекурсивную загрузку? Как, например, загрузить все ссылки на странице, а затем загрузить все ссылки, содержащиеся на каждой из этих страниц, и т. Д.? Чтобы я в основном отражал все дерево каталогов по ссылкам? Вроде как -rвариант wget?

Рашер
источник

Ответы:

7

DownThemAll не выполняет рекурсивную загрузку. Он только захватывает ссылки с текущей страницы. Загружаются только HTML-страницы связанных URL-адресов. Изображения и носители на связанных страницах не загружаются.

Shibu
источник
6

SpiderZilla предназначена для этого, но немного устарела (2006).
Он основан на ксероксе веб-сайта HTTrack .
Который имеет обновленные версии для всех платформ.

Существует также еще один более старый аддон, который может позволить вам подключить wgetсаму себя (помимо прочего).

Тем не менее, я тоже чувствую, что DownThemAll, вероятно, хороший выбор.
Если вы знаете, что вы хотите отразить, выбор правильных ссылок не должен быть проблемой.
И вы всегда можете поставить галочку «Все».

Итак, +1, для DownThemAll, если вы хотите придерживаться браузера.
И используйте HTTrack, если вам нужен автономный инструмент (а wget не удобен).

Обновление: вы также можете посмотреть голоса HTTrack на этот вопрос о вознаграждении,
Как я могу скачать весь сайт .

Nik
источник
DTA не поддерживает рекурсию
Hayden Thring
4

Вы можете использовать wget -rс куки из браузера, извлеченные после авторизации.

Firefox имеет опцию «Копировать как cURL» в контекстном меню запроса страницы на вкладке «Сеть» Инструментов для веб-разработчиков, горячие клавиши Ctrl + Shift + Q (вам может потребоваться перезагрузить страницу после открытия инструментов): Скриншот

Замените флаг заголовка curl на -Hwget --header, и у вас есть все необходимые заголовки, включая файлы cookie, чтобы продолжить сеанс браузера с помощью wget.

пользователь
источник