Предположим, у меня есть PDF, и я хочу получить любые метаданные, доступные для этого PDF. Какую утилиту я должен использовать?
Я нахожу часть информации, которую я обычно больше всего интересуюсь, - это размер бумаги, о котором обычно не сообщают зрители PDF. Например, буква формата PDF, легальная, A4 или что-то еще? Но другая доступная информация также может представлять интерес.
РЕДАКТИРОВАТЬ: Вот полезный справочник по размерам бумаги, благодаря @terdon.
pdf
file-metadata
Фахим Митха
источник
источник
Ответы:
Один из канонических инструментов для этого
pdfinfo
, который, если я помню, поставляется с xpdf. Пример вывода:источник
pdfinfo
чтобы ее можно было поднять.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Еще одна полезность, которую стоит изучить - это exiftool . Это может быть не тот инструмент в вашем конкретном случае, поскольку он не сообщает никакой информации о геометрии документа, но в целом это, вероятно, наиболее полнофункциональный инструмент для проверки метаданных PDF.
Вот пример команды, которая напечатает всю доступную метаинформацию (
-a
), отсортированную по группам (-G1
):Официальная документация предлагает обзор поддерживаемых тегов, связанных с PDF:
Вы можете установить exiftool в Debian / Ubuntu с помощью:
Если вам больше нравится GUI, попробуйте мой проект PDFMtEd . Это набор инструментов, которые служат графическим интерфейсом для exiftool и позволяют просматривать и редактировать метаданные PDF.
Вот пара скриншотов:
источник