Мне нужно обработать некоторые файлы PDF. Задача состоит в том, чтобы заменить один файл изображения другим. Моя первая проблема - как заменить изображение PDF из командной строки в пакетном процессе. Далее я попытаюсь решить другие проблемы, например, как определить, какое изображение мне нужно заменить (поскольку файлы PDF могут содержать более одного изображения). Но сначала я хочу решить первую проблему: как заменить изображение в PDF другим.
Я читал о poppler-utils и pdftk, но, насколько мне известно, ни один из этих инструментов не позволяет заменять изображения в PDF.
command-line
pdf
images
Иван
источник
источник
Ответы:
ОК ... Я думаю, что
pdflatex
это недостающий кусок здесь.ОП сказал, что он изучил
poppler-utils
иpdftk
. Позвольте мне добавить к этомуpdfimages
. Это вместе сpdflatex
частями решения.В приведенном выше примере кода
pdfimages
просматривает страницы с 4 по 20target.pdf
и извлекает все изображения в файлы с именами в началеimageroot
.poppler-utils
обеспечиваетpdftotext
. Я рекомендую-layout
вариант, который делает большую работу, сохраняя документ читабельным.OP возражает против
imagemagick
решения, предложенного пидозавром , что изображение не имеет извлекаемого текста. С помощью утилит, которые я обрисовал в общих чертах, у OP теперь будут все изображения, а также весь извлеченный текст, а номера страниц и содержимое сохраняются этой-layout
опцией. ОП может идентифицировать правильную страницу текста и поместить ее в.tex
файл, который заканчивается%includegraphics
директивой и ссылается на замену изображения по имени файла. Затем выpdflatex
получите это и получите новый одностраничный .pdf для вставки в остальную часть вашего документаpdftk
. Если вы знали, где в тексте исходной страницы находилось изображение, вы можете%includegraphics [h]
и получить изображение в нужном месте.источник