У вас есть идеи, как извлечь часть документа PDF и сохранить его в формате PDF? На OS X это абсолютно тривиально, используя Preview. Я пробовал PDF-редактор и другие программы, но безрезультатно.
Мне нужна программа, в которой я выбираю нужную часть, а затем сохраняю ее в формате PDF с помощью простой команды, такой как CMD+ Nв OS X. Я хочу сохранить извлеченную часть в формате PDF, а не в формате JPEG и т. Д.
pdfshuffler
в репо.pdfshuffler
больше не работает в Ubuntu 14.04+. Вы всегда можете использовать диалоговое окно печати или альтернативу на основе терминала, напримерpdfseparate
apt-get
меня, все еще отлично работает в 16.04. Может быть, они исправили ошибки, если они были?Ответы:
pdftk
полезный многоплатформенный инструмент для работы ( домашняя страница pdftk ).Вы передаете имя файла основного файла PDF, затем говорите, что он включает только определенные страницы (в данном примере 12-15) и выводит его в новый файл.
источник
pdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
pdftk
недоступно в Ubuntu 18.04. (см. askubuntu.com/questions/1028522/… )pdftk
это, безусловно, инструмент, который может сделать эту работу, я бы рекомендовал против этого. Это не свободное программное обеспечение, а неуклюжая часть условно-бесплатного программного обеспечения. Также это нуждается в JVM. Более разумный инструментqpdf
, как предлагается в другом ответе .очень просто, используйте программу чтения PDF по умолчанию:
распечатать как файл. это оно!
тогда
источник
Диапазон страниц - сценарий Наутилус
обзор
Я создал немного более продвинутый скрипт на основе учебника @ThiagoPonte, на который ссылается. Его ключевые особенности
Скриншот
Код
Монтаж
Пожалуйста, следуйте общим инструкциям по установке скриптов Nautilus . Обязательно внимательно прочитайте заголовок сценария, так как это поможет уточнить установку и использование сценария.
Частичные страницы - PDF Shuffler
обзор
Монтаж
использование
PDF-Shuffler может обрезать и удалять отдельные страницы PDF. Вы можете использовать его для извлечения диапазона страниц из документа или даже частичных страниц, используя функцию обрезки:
Элементы страницы - Inkscape
обзор
Inkscape - очень мощный редактор векторной графики с открытым исходным кодом. Он поддерживает широкий спектр различных форматов, включая файлы PDF. Вы можете использовать его для извлечения, изменения и сохранения элементов страницы из файла PDF.
Монтаж
использование
1.) Откройте файл PDF по вашему выбору с Inkscape. Откроется диалоговое окно импорта. Выберите страницу, с которой вы хотите извлечь элементы. Оставьте остальные настройки такими, какие они есть:
2.) В Inkscape нажмите и перетащите, чтобы выбрать элемент (ы), которые вы хотите извлечь:
3.) Инвертировать выделение с помощью !и удалить выделенный объект с помощью DELETE:
4.) Обрежьте документ до остальных объектов, открыв диалоговое окно « Свойства документа » с помощью CTRL+ SHIFT+ Dи выбрав «подогнать документ к изображению»:
5.) Сохраните документ в виде файла PDF из диалогового окна Файл -> Сохранить как :
6.) Если в вашем обрезанном документе есть растровые / растровые изображения, вы можете установить их DPI в следующем диалоговом окне:
7.) Если вы выполнили все шаги, вы получите настоящий PDF-файл, который состоит только из объектов по вашему выбору:
источник
pdfshuffler
недостаточно, если вы хотите извлечь часть страницы PDF. Исходные данные PDF страницы все еще сохраняются в файле. Не используйте этот метод, если вы хотите удалить конфиденциальные данные из файла PDF.pdfshuffler
сейчас называетсяpdfarranger
.QPDF отлично. Используйте его таким образом, чтобы извлечь страницы 1-10
input.pdf
и сохранить его какoutput.pdf
.Обратите внимание, что
input.pdf
написано дважды.Вы можете установить его, вызвав:
Это отличный инструмент для манипулирования PDF, который очень быстрый, имеет очень мало зависимостей. «Он может зашифровать и линеаризовать файлы, раскрыть внутреннюю часть файла PDF и выполнить множество других операций, полезных для конечных пользователей и разработчиков PDF».
http://sourceforge.net/projects/qpdf/
источник
--
) действительно странный..
вместо входного файла в опциях --pages:qpdf --pages . 1-10 -- input.pdf output.pdf
.Сохраните это как скрипт оболочки, например, pdfextractor.sh:
Для запуска введите:
4
ссылается на страницу, на которой начнется новый PDF.20
ссылается на страницу, на которой будет заканчиваться PDF.myfile.pdf
это PDF-файл, который вы хотите извлечь части.Вывод будет
myfile_p4_p20.pdf
в том же каталоге, что и оригинальный файл PDF.Все это и дополнительная информация здесь: Tech Tip
источник
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
"-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"
и т. д. (обратите внимание на кавычки)).В любой системе, в которой установлен дистрибутив TeX:
Например:
См. Https://tex.stackexchange.com/a/79626/8666.
источник
Существует утилита командной строки, которая называется pdfseparate .
Из документов:
Или выбрать одну страницу (в данном случае первую страницу) из файла sample.pdf:
источник
pdftk
pdftk
(sudo apt-get install pdftk
) - отличная командная строка для работы с PDF. Вот несколько примеров того, чтоpdftk
можно сделать:В вашем случае я бы сделал:
источник
Вы пробовали PDF Mod?
Вы можете, например .. извлечь страницы и сохранить их в формате PDF.
Описание:
PDF Mod - это простой инструмент для изменения PDF документов. Он может вращать, извлекать, удалять
и изменять порядок страниц с помощью перетаскивания. Несколько документов могут быть объединены с помощью перетаскивания
. Вы также можете редактировать заголовок, тему, автора и ключевые слова
документа PDF, используя PDF Mod.
Надеюсь, это будет полезно.
Regars.
источник
Я пытался сделать то же самое. Все, что вам нужно сделать, это:
установить
pdftk
:если вы хотите извлечь случайные страницы:
если вы хотите извлечь диапазон:
Пожалуйста, проверьте источник для получения дополнительной информации.
источник
Как оказалось, я могу сделать это с
imagemagick
. Если у вас его нет, просто установите:Примечание 1 : я попробовал это с одностраничным PDF (я учусь использовать
imagemagick
, поэтому я не хотел больше проблем, чем необходимо). Я не знаю, будет ли / как он будет работать с несколькими страницами, но вы можете извлечь одну интересующую страницу с помощьюpdftk
:где вы указываете номер страницы, которая будет выделена (в примере выше,
A1
выбирается первая страница).Примечание 2 : Полученное изображение с использованием этой процедуры будет растровым.
Откройте pdf с помощью команды
display
, которая является частьюimagemagick
пакета:Моя выглядела так:
Нажмите на изображение, чтобы увидеть версию с полным разрешением
Теперь вы нажимаете на окно, и меню всплывает в сторону. Там выберите Transform | Crop .
Вернувшись в главное окно, вы можете выбрать область, которую хотите обрезать, просто перетащив указатель (классический выбор от угла к углу).
Обратите внимание на указатель в форме руки вокруг изображения при выборе
Этот выбор можно уточнить, прежде чем перейти к следующему шагу.
Как только вы закончите, обратите внимание на маленький прямоугольник, который появляется в верхнем левом углу (см. Изображение выше). Он показывает размеры области, выбранной сначала (например
281x218
), а затем координаты первого угла (например+256+215
).Запишите размеры выбранной области; он понадобится вам в момент сохранения обрезанного изображения.
Теперь, вернувшись в всплывающее меню (которое теперь является определенным «обрезанным» меню), нажмите кнопку « Обрезать» .
Наконец, как только вы будете удовлетворены результатами обрезки, нажмите на меню Файл | Сохранить
Перейдите в папку, в которую вы хотите сохранить обрезанный файл PDF, введите имя, нажмите кнопку « Формат» , в окне «Выберите тип формата изображения» выберите PDF и нажмите кнопку « Выбрать» . Вернувшись в окно «Обзор и выбор файла», нажмите кнопку « Сохранить» .
Перед сохранением
imagemagick
попросим «выбрать геометрию страницы». Здесь вы вводите размеры вашего обрезанного изображения, используя простую букву «х» для разделения ширины и высоты.Теперь вы можете сделать все это отлично из командной строки (команда
convert
с опцией-crop
) - конечно, это быстрее, но вам нужно заранее знать координаты изображения, которое вы хотите извлечь. Проверьтеman convert
и пример на их веб-странице .источник
imagemagick
работает только растровые изображения, иdisplay
это только одна команда из набора. Есть много интерфейсов дляimagemagick
- проверьте их веб-страницу. Я думаю, что для векторных изображений лучшим решением будет ваш метод с Inkscape.PDF Split and Merge весьма полезен для этой и других операций с PDF.
Скачать отсюда
источник
sudo apt-get install pdfsam
). Тем не менее, версия в Ubuntu довольно устарела, так как она все еще в версии 1.1.4, тогда как версия sourceforge уже 2.2.2.Поскольку первоначальный пользователь попросил интерактивный инструмент, а не инструмент командной строки: простое решение - это использовать любой просмотрщик PDF (обычно в Kubuntu, evince или даже Firefox в Ubuntu), а затем просто использовать стандартный диалог печати, выбрать «печать в PDF-файл », а затем выберите в расширенном диалоговом окне настроек, какие страницы« распечатать ». Этот вариант имеет некоторые недостатки, так как некоторые уловки в исходном PDF-файле (например, повернутые страницы, формы и т. Д.) Могут быть потеряны, но он работает просто для большинства простых PDF-файлов.
источник
Если вы хотите извлечь из ваших PDF-файлов, вы можете использовать http://www.sumnotes.net . Это удивительный инструмент для извлечения заметок, основных моментов и изображений из PDF-файлов. Вы также можете посмотреть учебники на Youtube, набрав
sumnotes
.Я надеюсь, вам понравится!
источник