Я использовал wget для загрузки html-файлов, где хранятся изображения в файле?

15

Firefox загружался очень медленно, поэтому я решил использовать wgetдля сохранения HTML-файлы. Я использовал следующую команду:

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Файлы были сохранены в моей домашней папке. Но я не знаю, где хранятся изображения. Мне нужно их использовать Anki.

Так где хранятся изображения?

зарегистрированный пользователь
источник
Эта статья объясняет варианты и как они полезны.
Уилф

Ответы:

34

Я предпочитаю использовать --page-requisites( -pдля краткости) вместо этого -rздесь, поскольку он загружает все, что нужно для отображения страницы, но никаких других страниц, и мне не нужно думать о том, какие файлы мне нужны.

На самом деле я обычно использую что-то вроде

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Это означает:

  • -E: Добавить .htmlк имени файла, если это файл HTML, но не заканчивается .htmlили похож
  • -H: Загрузка файлов с других хостов тоже
  • -k: После загрузки конвертируйте в него любую ссылку, чтобы они указывали на загруженные файлы
  • -p: Загрузите все, что нужно странице для правильного просмотра в автономном режиме
Флориан Диш
источник
Я пришел сюда в поисках -H, и был рад узнать о -Eи -kтоже. Благодарность!
Чарльз Клэйтон
2

Использование параметра -r должно позволить wget загрузить всю папку, включая ваши изображения.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
Вегард Торвунд
источник
2

Загрузка файлов изображений отдельно

Я думаю, что эта команда поможет вам начать.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Это позволяет вам указать место для сохранения изображений и какие типы файлов вы хотите. Может быть, загрузка изображений как таковых проще.

Источник :

-r включает рекурсивный поиск. См. Рекурсивная загрузка для получения дополнительной информации.

-P устанавливает префикс каталога, в который сохраняются все файлы и каталоги.

-A устанавливает белый список для извлечения только определенных типов файлов. Строки и шаблоны принимаются, и оба могут использоваться в списке через запятую (как показано выше). См. Типы файлов для получения дополнительной информации.

Копирование файлов изображений из вашей папки

Я заметил, что на сайте используются файлы изображений PNG. Вы можете просто скопировать их из своей папки. Это должно быть выполнено в папке, где вы сохранили веб-страницу.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
don.joey
источник
1

Wget просто загружает HTML-файл страницы, а не изображения на странице, поскольку изображения в HTML-файле страницы записываются в виде URL-адресов. Чтобы сделать то, что вы хотите, используйте -R(рекурсивную) -Aопцию с суффиксами файла изображения, --no-parentопцию, чтобы она не поднималась, и --levelопцию с 1.

конкретно wget -R -A .jpg,.png,.gif --no-parent --level <url>

Более того, в большинстве браузеров есть способы сохранения страниц для просмотра в автономном режиме .

Рамчандра Апте
источник