Как в Linux получить URL-адрес и получить его содержимое в переменной в сценарии оболочки?
115
Вы можете использовать wget
команду, чтобы загрузить страницу и прочитать ее в переменной как:
content=$(wget google.com -q -O -)
echo $content
Мы используем -O
вариант, wget
который позволяет нам указать имя файла, в который wget
выгружается содержимое страницы. Мы указываем -
выводить дамп на стандартный вывод и собирать его в переменную content
. Вы можете добавить -q
тихую опцию, чтобы отключить вывод wget.
Для этого можно использовать команду curl, а также:
content=$(curl -L google.com)
echo $content
Нам нужно использовать эту -L
опцию, поскольку запрашиваемая страница могла быть перемещена. В этом случае нам нужно получить страницу из нового места. Опция -L
или --location
помогает нам в этом.
src
атрибут правильного элемента, а затем загрузить эту страницу. Если вы устанавливаете tq , эта команда должна это сделать:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wget
convert_links = on
с-O-
опцией. Выдает ошибку-k can be used together with -O only if outputting to a regular file.
. Ожидается?Есть много способов получить страницу из командной строки ... но это также зависит от того, хотите ли вы исходный код или саму страницу:
Если вам нужен исходный код:
с завитком:
с wget:
но если вы хотите получить то, что видите в браузере, вам может пригодиться lynx:
Я думаю, вы можете найти так много решений этой маленькой проблемы, возможно, вам стоит прочитать все страницы руководства по этим командам. И не забудьте заменить
$url
на свой URL :)Удачи :)
источник
Есть
wget
команда илиcurl
.Теперь вы можете использовать файл, который вы загрузили с помощью wget. Или вы можете обработать поток с помощью curl.
Ресурсы :
источник
источник
Если у вас установлен LWP , он предоставляет двоичный файл с именем « GET ».
wget -O-
,curl
Иlynx -source
ведут себя аналогичным образом .источник
Вы можете использовать
curl
илиwget
для получения необработанных данных, или вы можете использовать,w3m -dump
чтобы иметь красивое текстовое представление веб-страницы.источник