Есть ли фильтр Linux, который преобразует HTML в простой и довольно отформатированный текст?

3

Я хотел бы отфильтровать html-ответ, поступающий с выхода cURL. Какой фильтр я должен применить? Просмотр html-контента с помощью Midnight Commander не проблема, он показывает их в виде довольно отформатированного простого текста, так что я думаю, что такой фильтр есть.

Константин
источник

Ответы:

3

Мы называем эти фильтры «веб-браузерами» - программой, которая анализирует HTML-код и выводит симпатичный документ.

Links - это один из консольных веб-браузеров, который работает в Linux.

Elinks это еще один.

Также есть W3M .

Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его в браузере с графическим интерфейсом, например Firefox, Chrome, Opera и т. Д.

Пожалуйста, не используйте регулярные выражения для разбора HTML .

РЕДАКТИРОВАТЬ . Я только что понял, что вы можете захотеть улучшить ваш HTML и увидеть его с помощью тегов. В этом случае вы можете использовать HTML Tidy Library Project или

скопируйте ваш HTML в текстовый файл и окружите его <pre> </pre>тегами. Затем откройте его с помощью браузера.

VL-80
источник
+1 за «Мы называем эти фильтры« Веб-браузеры »« Ха!
Lornix
1

Если вы просто хотите посмотреть привлекательный html-вывод curl, тогда достаточно w3m, links или lynx, как указано выше.

Если вы хотите проанализировать или сделать что-нибудь с выходными данными, то я рекомендую либо пакет html-xml-utils linux, либо Beautiful Soup, который является очень удобным пакетом Python для любого проекта, который включает в себя очистку веб-страниц.

Mavus
источник
0

Полночный командир использует «ссылки» или «рысь». Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.

wmills
источник