Я хочу отредактировать метаданные отсканированного PDF-файла, чтобы назначить индивидуальные номера страниц различным страницам. Например, какие сейчас страницы 1-3 я могу назвать i, ii и iii, а какие страницы 4-10 я хочу назвать 1-7. Я не хочу менять фактический порядок страниц.
Есть ли А) Способ сделать это вообще с помощью бесплатных инструментов; и B) способ сделать это «в пакетном режиме» (так, без необходимости перенумерации каждой страницы вручную).
software-recommendation
pdf
MarkovCh1
источник
источник
Ответы:
Здесь решение на основе LaTeX. Он использует
pdfpages
пакет для включения отсканированного PDF (здесь он называетсяscan.pdf
). Нужные метки страницы PDF можно установить с помощьюhyperref
пакета сpdfpagelabels
включенной опцией. В\thepage
качестве метки он использует обычный макрос, который можно определить для строчных римских чисел. Затем счетчик страниц сбрасывается и возвращается к нормальным числам.Поместите приведенный выше код в файл (например
scan_mod.tex
) и скомпилируйте егоpdflatex
:Это будет производить
scan_mod.pdf
. Однако любые специальные аннотации вкл. гиперссылки исчезнут. Это не должно быть проблемой с отсканированными PDF-файлами.Если вам это нужно чаще, вы можете написать скрипт, который принимает количество страниц с римскими номерами и имена файлов в качестве аргументов и создает временный файл с приведенным выше кодом, где имя и числа являются переменными, который затем компилируется.
источник
Вы можете сделать это с помощью текстового редактора.
Как говорится в ответе, откройте файл PDF с помощью текстового редактора, выполните поиск
/Catalog
, а затем добавьте запись с именем,/PageLabels
подобным следующему:Обратите внимание, что индексы страниц (физические номера страниц) начинаются с
0
.Конечно, вы можете сделать это автоматически, используя скриптовые языки.
Стандарты PDF - Ярлыки страниц имеют подробную спецификацию.
источник
jPDF Tweak - это графическая утилита с открытым исходным кодом, которая предлагает нумерацию страниц (правильный термин «маркировка страницы») и многие другие новички в расширенных функциях редактирования PDF. Он работает на Ubuntu и других операционных системах.
Страница документации содержит пошаговые инструкции.
источник
Существует инструмент под названием PDF Mod, который является бесплатным инструментом для изменения порядка страниц PDF.
Его можно установить из Ubuntu Software Center в Ubuntu 10.10 и выше.
Чтобы установить в Ubuntu 9.10 или 10.04:
Для установки Добавьте ppa
ppa:pdfmod-team/ppa
к источникам вашего программного обеспечения ( Вот как это сделать ) и установите pdfmod из центра программного обеспечения.Адаптировано с: http://www.webupd8.org/2011/03/edit-pdf-documents-in-linux-with-pdf.html
Удачи: D
источник
Просто нашел указатель, который можно использовать
ghostscript
для этого, здесь: pdftk - Добавить и редактировать закладки в pdf - Unix и Linux - Stack Exchange # 18600 ; это относится к ссылкам:Однако вышеизложенное касается закладок, а не логической нумерации страниц. Получается из pdfmarkReference.pdf , необходимая «команда» - это
/Label
«(или/PAGELABEL
») - и далее это относится к PDFReference.pdf, глава 8.3.1 «Метки страницы». К сожалению, эта глава не обязательно объясняет, как pdfmarks можно использовать с ярлыками страниц - но этот пост делает:... и далее в этой теме:
РЕДАКТИРОВАТЬ: просто чтобы показать это - если вы сохранили это как
pdfmarks
файл:... и вы звоните:
... тогда в конце вы получите три пустые страницы
infile.pdf
, помеченные -1, 0 и 1 :)Ну, может быть, это поможет когда-нибудь получить более простой
gs
скрипт для перенумерации страниц :)Ура!
РЕДАКТИРОВАТЬ 2: Думаю, понял - используйте ту же
gs
команду, что и выше - и ниже приведено содержимоеpdfmarks
скрипта, который перенумерует infile.pdf, поэтому он начинается с -1, 0, 1 ... Это в основном модифицированный пример из PDF-ссылка (см. комментарии для более):источник
Есть небольшой скрипт на python, который может сделать эту работу: https://github.com/lovasoa/pagelabels-py
В вашем случае позвоните:
источник
Openoffice / Libreoffice может справиться с расширением pdf-import и макросом разбиения на страницы.
Не идеальное решение, но оно работает для меня (кроме использования PDF Mod - который я настоятельно рекомендую).
источник
Попробуйте pyPdf , библиотеку python для работы с PDF-документами. Некоторое, но не очень, программирование было бы необходимо.
Вы также можете взглянуть на PDFtk , хотя я не проверял, поддерживает ли он изменение номера страницы, связанной с отдельными страницами. Оба доступны в виде пакетов в Ubuntu.
источник
Существует еще одно приложение, которое называется PDFEdit - его размещают в Source Forge. Страница проекта Source Forge - Однако это не помогает, потому что это не та функциональность, которая вам требуется
источник
pdfedit
может показатьCatalog/PageLabels
Dict, если документ есть, но если он выбран, он говорит: « Этот словарь не имеет каких-либо непосредственно редактируемых свойств » ... Ура!