Просмотрщик метаданных PDF / редактор тегов для Ubuntu

26

Существует множество вопросов и ответов относительно лучшего средства просмотра PDF, доступного в Ubuntu, но я хочу проанализировать файл PDF и узнать подробности о PDF, такие как изображения, шрифты и ссылки, которые доступны в данном файле PDF.

Есть ли в наличии средства просмотра метаданных PDF / редакторы тегов?

Сахил Гровер
источник
2
Близкие избиратели: только потому, что этот вопрос говорит «лучший» в названии, это не делает его основанным на мнении!
Сет

Ответы:

31
  1. Просмотрите метаданные pdf для файла с именем Example.pdf:

    pdfinfo Example.pdf  
    
  2. Отредактируйте существующие метаданные в терминале с помощью нано-редактора:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. Обновить метаданные:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    


Сочетания CtrlOEnterклавиш в редакторе Nano Используйте комбинацию клавиш + и после этого нажмите, чтобы сохранить файл в его текущем местоположении.
Используйте комбинацию клавиш Ctrl+ Xдля выхода из нано.

Карел
источник
10

CLI решение

Еще одна полезность, которую стоит изучить - это exiftool . Преимущество exiftool перед pdfinfo заключается в том, что он поддерживает гораздо больше типов метаданных (например, теги XMP).

Вот пример команды, которая напечатает всю доступную метаинформацию ( -a), отсортированную по группам ( -G1):

exiftool -a -G1 "$File"

Обзор поддерживаемых тегов, связанных с PDF:

Вы можете установить exiftool в Ubuntu с помощью:

sudo apt-get install libimage-exiftool-perl

GUI решение

Если вы ищете средство просмотра / редактирования метаданных PDF с графическим интерфейсом, вы можете попробовать PDFMtEd . Это набор графических утилит, которые я написал для управления метаданными PDF с помощью exiftool:

введите описание изображения здесь

введите описание изображения здесь

Glutanimate
источник
1

Ответ «лучший» действительно зависит от того, сколько деталей вы хотите и от того, насколько стабильным вы хотите, чтобы зритель был. Существует множество программ для просмотра и даже редактирования пост-скриптов и PDF-файлов в Linux; все, что, кажется, было удалено из текущих репозиториев Ubuntu (вероятно, из-за проблем со стабильностью).

Сейчас я бы порекомендовал попробовать pdfedit. Если вы используете Quantal или ранее, его можно установить через

sudo apt-get install pdfedit

Для новых версий вам нужно скачать его со страницы проекта , распаковать его и скомпилировать самостоятельно.

virtualxtc
источник
Я не хочу зрителя. Мне нужен парсер, который может извлекать подробности из pdf-файла, такие как ссылки, доступные в файле .... изображения, доступные ... индекс файла и т. Д.
Sahil Grover
Извините, pdftk перепутали с pdfedit, потому что они удалили pdfedit из репозиториев
virtualxtc
0

Подробно о pdftkметоде редактирования, который хорош, потому что он показывает вам все, что установлено, и в то же время позволяет вам изменять что угодно, вот скрипт (для вашего .bashrcили другого файла псевдонимов), чтобы сделать это с помощью одной команды , Это создаст новую версию файла, который вы хотите отредактировать, откроет ваш любимый редактор с метаданным, а затем внесет ваши изменения и установит время создания / изменения файла в измененном PDF-файле таким же, как и в оригинале. Чтобы использовать его, выделив .bashrcфайл, просто введите

editPDFmetadata myfile.pdf

Вот псевдоним:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Просто поместите приведенное выше определение в .bashrcфайл в вашей домашней папке, затем откройте новый терминал, и он будет готов к использованию.

CPBL
источник
0

sudo apt-get install libimage-exiftool-perl

Метаданные могут быть полностью удалены с помощью следующей команды

exiftool -all:all= file_name

Foreever
источник