У меня есть PDF, который содержит отсканированное изображение документа. Я хочу сохранить содержимое этого PDF-файла в виде изображения, чтобы затем запустить его через программу OCR, которая принимает только файлы типа .jpg, .png и .gif.
Как сохранить / преобразовать этот PDF-файл в один из этих графических форматов?
РЕДАКТИРОВАТЬ: Один из способов, которые я нашел, это нажать на каждую страницу. Скопировать в буфер обмена. Вставьте в Paint.net и сохраните. Однако это громоздко, так как кажется, что вы можете выбрать только одну страницу за раз в Acrobat Reader.
%d
выходного файла - это переменная, которая заменяется номером страницы. (Почти наверняка необработанные числа, а не числа внутри PDF.)Установите Imagemagick . Откройте окно cmd или терминал:
Выходными данными будет 1 файл jpg для каждой страницы в вашем pdf, test-0.jpg, test-1.jpg и т. Д.
источник
density
,depth
иquality
флаги , которые могут помочь вам оптимизировать производительность. Например:convert -density 300 -depth 8 -quality 85 a.pdf a.png
Больше информацииЭто также
pdfimages
из инструментов Xpdf (доступно с сайта XpdfReader ). Он не преобразует всю PDF-страницу в изображение, а извлечет встроенные изображения из PDF-файла.Это полезно, если PDF-файл содержит текст и изображения, а вам нужны только изображения. Кроме того, он будет извлекать изображения в их исходном формате, поэтому потери качества не возникает (в отличие от программ, которые визуализируют всю страницу, а затем преобразуют ее, например, в JPEG). В зависимости от ваших потребностей это может быть полезно.
Простое использование:
Это позволит прочитать входной файл
mydocument.pdf
, извлечь все изображения и записать их в отдельные файлы с именамиmydocument-images-0000.jpg
иmydocument-images-0001.jpg
т. Д.Опция
-j
позволяет записывать встроенные JPEG-сжатые изображения как файлы JPEG, а не как файлы PBM / PGM / PPM (которые являются несжатыми и огромными). Обратите внимание, что изображения по-прежнему могут быть записаны в виде файлов PBM / PGM / PPM, если они хранятся во входном файле PDF.источник
pdfimages -j "yourinputfile.pdf" "outputimages"
это "outputimages-0000.ppm" (или "outputimages-0000.jpg", если они в правильном формате). Примеры .NET можноВы можете сделать это с помощью Adobe Reader:
источник
За исключением ответа, в котором упоминается pdfimages, во всех остальных ответах не упоминается, что их решения фактически транскодируют встроенные изображения. То есть эти решения не просто извлекают исходное изображение, но и изменяют его, возможно, в ущерб изображению, во время процесса. Только pdfimages извлекает исходное изображение. Это относится к Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview и большинству других программ PDF.
источник
PDFill PDF Tools - это, вероятно, самый простой способ конвертировать ваши PDF-файлы в изображения в Windows. Это позволит вам экспортировать все страницы в формате PDF, чтобы разделить изображения за один снимок. Он также имеет множество других функций, доступных бесплатно, которые доступны только в других средствах просмотра PDF, если вы покупаете коммерческую или "Pro" версию.
Используйте кнопку «Преобразовать PDF в изображения» (кнопка № 10) на снимке экрана ниже.
Если вам нужно объединить изображения в одно очень высокое изображение, чтобы вам нужно было передать только один файл в программу распознавания, вы можете использовать IrfanView
источник
Поскольку вы не включили тег OS, я добавлю ответ OSX:
PDF-файлы по умолчанию открываются в Preview.app, что позволяет использовать
File -> Save-As
:источник
Также PDF Xchange Viewer (бесплатно) будет выполнять экспорт в файл. Файл → Экспорт → Экспорт в изображение.
Не только это, но я думаю, что это лучший бесплатный просмотрщик PDF для Windows, и у него есть несколько хороших возможностей разметки. У меня есть лицензия на Adobe Acrobat, и я все еще предпочитаю ее, если я не занимаюсь обширным редактированием, что бывает редко.
источник
(Не бесплатно) Acrobat professional делает это:
Дополнительно-> Обработка документов-> Экспорт всех изображений ...
источник
Если размер файла менее 5 МБ, и вы не беспокоитесь о конфиденциальности / конфиденциальности, то это удобный онлайн-сервис по адресу http://www.go2convert.com/, который может выполнять множество графических преобразований (включая PDF в JPEG).
источник
Если размер изображения превышает размер экрана, вы можете использовать функцию FastStone Capture (функция «Окно прокрутки захвата») и сохранить изображение в формате JPEG.
источник
Вы можете проверить эту статью .
В нем перечислены 6 различных способов конвертировать PDF в изображения.
Конвертировать PDF в JPG (веб-путь)
Конвертеры PDF в JPG для рабочего стола
источник