Я хочу скачать HTML (например: http://www.brpreiss.com/books/opus6/ ) и присоединить его к одному HTML или другому формату, который я могу использовать для чтения электронных книг. Сайты с бесплатными книгами не имеют стандартной подкачки страниц, они не являются блогами или форумами, поэтому не знаете, как выполнить автоматический обход и объединение.
ebook
web-crawler
Hrvoje Hudo
источник
источник
То, как я делал это, было Caliber.
Это стало слишком большой болью, поэтому я создал Chrome Extension, чтобы упростить его.
Это называется EpubPress ( http://epub.press ).
Это позволяет создавать электронные книги из вкладок Chrome.
Надеюсь, это поможет!
источник
Pandoc может взять ссылку на страницу (или HTML-файл) и преобразовать ее в pdf / epub ...
Я не уверен, что это будет ползти. Если этого не произойдет, вы можете сначала сканировать страницы с помощью wget или чего-то еще (или просто собирать ссылки) и передавать их pandoc.
источник
Вы можете использовать https://getpocket.com и карманный рецепт калибра, доступный через меню «Получить новости».
источник
HTTrack является хорошим вариантом - он будет создавать электронную книгу с веб-сайта: ее можно скачать здесь: https://www.httrack.com/ HTTrack "позволяет загружать сайт World Wide Web из Интернета на локальный каталог, рекурсивно создавая все каталоги, передавая HTML, изображения и другие файлы с сервера на ваш компьютер. HTTrack организует относительную структуру ссылок исходного сайта. "
Затем вы можете конвертировать HTML в EPUB, AZW3 или PDF с помощью Caliber или любого другого программного обеспечения для конвертации HTML в epub.
Второй вариант для прямого преобразования в EPUB - это EpubPress: он имеет расширения, позволяющие использовать Firefox (только v44.0 +) или Chrome. Чтобы использовать это программное обеспечение, вам нужно открыть окно браузера. Каждая вкладка - это, по сути, «глава» в вашей электронной книге. Расположите вкладки в нужном порядке появления, затем активируйте epubpress - он загрузит и упорядочит вкладки в порядке их появления в формате .epub. Надеюсь это поможет!
* Однако обратите внимание, что EpubPress загружает отдельные веб-страницы, а не «веб-сайт», как делает HTTrack. Чтобы загрузить веб-сайт с EpubPress, вы должны открыть каждую ссылку на веб-сайте в виде отдельной вкладки, а затем использовать Epubpress для сбора этих ссылок в формате .epub.
источник