«Распечатать» веб-страницу в pdf с работающими гиперссылками

11

Я печатаю множество веб-страниц в формате pdf, используя CutePDF. URL-адреса поддерживаются как активные ссылки в документе PDF, но гиперссылки не генерируют активную ссылку.

Есть ли какой-нибудь, желательно бесплатный, PDF-принтер, который поддерживает активные гиперссылки при печати веб-страниц?

(И, пожалуйста, не советуйте никаким инструментам, которые специально не делают этого)

Я использую Firefox, но не думаю, что браузер должен иметь значение.

bretddog
источник
Не уверен, что именно вы подразумеваете под маскированными гиперссылками. Согласно известному определению маскированной гиперссылки это не имеет значения для PDF-принтера. На самом деле PDF-принтер не имеет возможности узнать, к чему ведет гиперссылка, поэтому он не различает замаскированные и немаскированные ссылки.
Арт Гертнер
СМЦ; Я просто имею в виду обычный текст с гиперссылкой, такой как; superuser Если замаскировано неверно, какой термин для этого?
bretddog,
Термин гиперссылка . Не имеет ничего общего с маскировкой. Обычный текст называется URL . Гиперссылка - это интерактивный объект, по которому вы переходите на URL . Пожалуйста, прочитайте вики: гиперссылка и вики: URL . Также не забудьте обновить свой вопрос (включая заголовок)
Арт Гертнер

Ответы:

4

Сначала я должен заверить вас, что имеет значение, какой браузер вы используете. Если вы не используете стандартный диалог печати ОС, браузер будет использовать свою собственную библиотеку для создания PDF. Результаты будут отличаться в разных браузерах.

Так же, как эксперимент, я напечатал эту страницу, используя Firefox и Chromium. Firefox не сохранил никаких кликабельных ссылок. Хром сэкономил около 50%, и выбор казался довольно случайным.

Я считаю, что лучшим решением для вас было бы установить надстройку / расширение для браузера, которое выполнит эту работу.

Я сделал быстрый поиск, и для Firefox я нашел этот: имя с невообразимым названием Print pages to Pdf . Прямая ссылка на последнюю версию: 0.5.0.6 .

Создает один файл PDF из любого количества открытых страниц браузера, закладок / папок, альбомов Scrapbook (Plus). Этот документ может быть заархивирован, отправлен [sic] по электронной почте или распечатан любым стандартным средством просмотра PDF.

если вы просмотрите список функций, вы найдете то, что ищете:

  • Сохраняет ссылки в формате PDF с содержания веб-страниц
  • Поддерживает локальные ссылки для навигации по веб-странице / pdf

Я кратко проверил его, и он правильно распечатал страницу со всеми кликабельными ссылками.

Арт Гертнер
источник
Ну, это выглядит довольно круто! :) Пока хорошие результаты и несколько приятных вариантов. Спасибо!
bretddog
1
Эти ссылки мертвы.
AllInOne
1
@AllInOne, обновлено
Арт Гертнер
@ArtGertner Ссылки на любую версию этого мертвы. (Я любил плагин раньше ..)
Малахи
5

Использование встроенного в Chrome виртуального принтера «Сохранить как PDF» - это еще один вариант. Это сработало для меня, когда расширение Firefox «печатать страницы в PDF» плохо испортило страницу (но действительно сохранило гиперссылки)

hetchel
источник
Документы W3C, такие как w3.org/TR/xmlschema11-1/#composition-schemaImport , похоже, не работают с таким подходом: связанный документ НЕ доступен для поиска, а ссылки НЕ работают.
Коппор
Только что протестировал эту страницу с последней версией Chrome. Документ доступен для поиска и внешние ссылки работают. Внутренние ссылки (на якорь на странице) НЕ РАБОТАЮТ (что является большой проблемой для этого типа документа). Использование «Печать страниц в PDF», кажется, дает лучший результат с этой страницей: с возможностью поиска, с работающими внешними и внутренними ссылками, и, похоже, правильно сохраняет макет.
Хетчел
3

wkhtmltopdf

На основании Печать страниц в PDF я предлагаю автономный инструмент wkhtmltopdf .

"c:\Program Files\wkhtmltopdf\bin\wkhtmltopdf" "http://www.example.com" test.pdf

Pandoc

wkhtmltopdf не работал в моем случае , поэтому я рекомендую Pandoc . Это немного сложнее, чтобы запустить его. С небольшими документами вы должны быть в состоянии запустить

pandoc http://www.example.org/ -o test.pdf

Если у вас есть документы UTF-8 с китайскими иероглифами, вы должны сделать это следующим образом:

pandoc http://blog.fefe.de/ -o test.tex
lualatex test.tex
lualatex test.tex

работа в процессе

Однако в моих конкретных настройках pandoc http://www.w3.org/TR/DOM-Parsing/ -o test.pdfэто привело к ошибке LaTeX.

! LaTeX Error: Too deeply nested.

Поэтому я создал файл латекса вручную:

pandoc http://www.w3.org/TR/DOM-Parsing/ --standalone -o test.tex

Затем мне пришлось отключить линию 78, потому что an \includegraphicsбыл внутри \href.

С предложенным хаком в stackoverflow (вставленный в строку 74, прямо перед \begin{document}), я также не смог запустить его ( pdflatex test).

Я открыл выпуск № 2438 в Пандоке.

koppor
источник
2

Плагин «Печать страниц в PDF» больше не доступен в Firefox. Я попробовал альтернативу, перечисленную в этой и других темах, но безуспешно.

Что работает:

  • Используйте панель инструментов Adobe PDF для Internet Explorer.
  • Используйте функцию «Преобразовать веб-страницу в PDF» на панели инструментов.
Эрик Т. Вийк
источник
По состоянию на 2015-10-07 Печать страниц в PDF по-прежнему доступна: см. Printpdf.pf-control.de/index.php/en/0.5.0.2.html
koppor
Спасибо за ваш комментарий. Я проверил сайт, на который вы ссылались, и следовал инструкциям по установке ( printpdf.pf-control.de/index.php/en/installation.html ). Эта страница ссылается на addons.mozilla.org/en-US/firefox/addon/. print-pages-to-pdf, где написано: «Это дополнение удалено его автором».
Эрик Т. Вийк
Пожалуйста, перейдите по ссылке, приведенной в первом абзаце моей ссылки. Текст гласит: «Если вы хотите скачать эту версию, вы можете сделать это по этой ссылке. (Если вы уже скачали 0.5.0.1, эта идентичная)». «Эта ссылка» ссылается на printpdf.pf-control.de/versions/0.5.0.2/xpi/…
koppor
1

Существует FireFox Addon «save-as-pdf», который сохраняет гиперссылки в PDF-документе: https://addons.mozilla.org/en-US/firefox/addon/save-as-pdf/

(это бесплатно, но разработано коммерческой компанией http://pdfcrowd.com )

Ноам Манос
источник
Стоит отметить, что это преобразование осуществляется в Интернете. Аддон отправляет URL-адрес в онлайн-сервис pdfcrowd, который преобразует его и возвращает PDF. Я не буду использовать это дополнение из-за проблем с конфиденциальностью - я не хочу знать pdfcrowd, какие сайты меня интересуют. Кроме того, будьте готовы к разного рода утечкам конфиденциальных данных при использовании этого сервиса (конфиденциальное содержимое страницы в вопрос, идентификаторы сеанса, закодированные в URL и т. д.), а также для аддона, не работающего, если данные входа / идентификатор сеанса передаются рассматриваемому веб-сайту посредством почтовых запросов.
Бинар