PDF умный файл diff

9

У меня есть документ LibreOffice, который я конвертировал в PDF в какой-то момент времени, используя встроенные возможности. Временная метка в PDF позже, чем в текстовом документе, так что это имеет смысл, но я не совсем уверен, что текстовый документ создает именно этот PDF. Документ имеет длину 20 страниц, поэтому не стоит проверять его вручную.

Одна из возможностей - повторить PDF-файл в другой папке, а затем выполнить двоичный анализ двух PDF-файлов. К сожалению, командная строка diffуказывает, что «двоичные файлы отличаются».

Существует ли «умный бинарный анализ», который поможет мне определить, есть ли разница только в метаданных или какая-то такая непоследовательная разница?

H2ONaCl
источник

Ответы:

13

В целом, это хорошая идея, чтобы проверить, что команда + расширение файла - то, что вы ищете. diff + pdf приводит к diffpdf .

sudo apt-get install diffpdf

DiffPDF используется для сравнения двух файлов PDF. По умолчанию сравнение выполняется для текста на каждой паре страниц, но сравнение внешнего вида страниц также поддерживается (например, если диаграмма изменена или переформатирован абзац). Также возможно сравнить определенные страницы или диапазоны страниц. Например, если существует две версии файла PDF, одна со страницами 1-12, а другая со страницами 1-13 из-за добавления дополнительной страницы в качестве страницы 4, их можно сравнить, указав два диапазона страниц: 1 -12 для первого и 1-3, 5-13 для второго. Это заставит DiffPDF сравнивать страницы в парах (1, 1), (2, 2), (3, 3), (4, 5), (5, 6) и т. Д. С (12, 13).

введите описание изображения здесь

Источник: Ubuntugeek.com .

Rinzwind
источник