Рекурсивный HTML в PDF

12

У меня есть папка с такой структурой:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

со многими подпапками и только html-файлами ... я хочу преобразовать все их в pdf, используя только одну команду или простой скрипт, который не требует всех имен файлов.

Вы знаете один

Маттео Пальяцци
источник

Ответы:

15

Я бы предложил установить инструмент WKHtmlToPDF с http://wkhtmltopdf.org/ (перенесено с http://code.google.com/p/wkhtmltopdf/ ).

Затем вы можете перейти в корневую папку и использовать find и xargs для их преобразования:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Затем будет создан PDF-файл с каждым HTML-файлом.

dan_linder
источник
я решил с помощью списка файлов и bash для, но это намного лучше!
Маттео Пальяцци
5

Следующая команда должна выполнить работу для одной ссылки:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Для нескольких ссылок не должно быть затруднительно написать цикл, который обрабатывает каждую ссылку по одной.

jcollado
источник