Как я могу легко удалить все комментарии и аннотации (добавленные с помощью Foxit Reader) из всех PDF-файлов в папке?
pdf
batch
ghostscript
Андрей
источник
источник
Ответы:
Я просто упал на эту проблему, и ни один из ответов, приведенных здесь, не работал для меня. Что же работа была
rewritepdf
инструментом из пакета Ubuntulibcam-pdf-perl
:Обернуть это в небольшой сценарий для удаления аннотаций из всех файлов PDF в каталоге теперь легко:
источник
Если вы работаете в системе Unix:
Это хак, который удаляет все
/Annots
команды из PDF (команды, которые рисуют аннотации). Он оставляет там объекты аннотаций (вы можете открыть PDF с помощью текстового редактора и искать их), они просто не прорисованы.источник
s:
(заменить)/Annots \[
(текст "/Annots [
")[^]]+
(один или несколько экземпляров любого символа, кроме "]
")\]
(буквальный символ "]
")::
(заменить все, что соответствует первому, ничем)g
(при необходимости заменить несколько раз в строке).]
обычно должен быть экранирован, но не сразу после^
отрицания.Много не проверял, но, похоже, работает следующее. Он удаляет все аннотации, кроме внутренних ссылок на документы (что, похоже, не дает ни один из ответов). Этот скрипт зависит от библиотеки Python pdfrw .
Использование:
PATH
), например/usr/local/bin/annotclean
.annotclean in.pdf cleaned.pdf
источник
Я думаю, что вы можете сделать это проще всего, "повторно" PDF. Повторное использование означает: сначала преобразовать файл в PostScript, затем преобразовать PostScript обратно в PDF. Обычно повторное осуждение осуждается, потому что обычно вы теряете качество и некоторый контент. В вашем случае вы хотите потерять контент. Повторное обжаривание может быть выполнено с помощью Ghostscript (и пакетных файлов помощника, поставляемых вместе с ним - загрузите,
gs900w32.exe
если вы работаете в Windows), так что все готово, с помощью двух простых команд:источник
Хорошо, вы сказали, что вы также рассмотрите коммерческое решение ....
Я бы порекомендовал вам попробовать каллы pdfToolbox . Он доступен для Windows и Mac OS X. (У них также есть CLI для Linux, но вы можете использовать только предварительно настроенные «профили» с ним. С помощью графического интерфейса Windows вы можете создавать свои собственные профили и повторно использовать их с Linux CLI, хотя.
У pdfToolbox есть много-много-много способов манипулировать и исправлять множество проблем PDF.
Одним из «исправлений» является удаление всех аннотаций.
Вам не нужно выкладывать деньги, чтобы сначала их проверить; Каллас выдает 14-дневные пробные лицензии бесплатно.
источник