Просмотр внутренней структуры PDF

18

Как просмотреть внутреннюю структуру PDF в Adobe 9.0?

Я не нашел расширенного меню, в котором есть эта опция.

Кто-нибудь может мне помочь?


источник

Ответы:

23

Есть несколько способов просмотреть внутреннюю структуру PDF.

PDF-файлы читаются человеком

За исключением паролей безопасности, большая часть из них читается человеком. Если PDF-файл имеет пароль, все строки и потоки (которые уже будут сжаты, без потерь) будут псевдослучайным мусором. Сжатые потоки данных имеются в большом количестве, но большая часть их выглядит примерно так в вашем любимом текстовом редакторе:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Предупреждение: пробелы в значительной степени не имеют значения и обычно удаляются, когда это возможно. Я просто сделал это красиво, чтобы было легче понять это.

<< и >> начало и конец словарей. Словари состоят из пар ключ / значение. Ключ всегда является «именем»: все имена начинаются с «/». Значение может быть любым, включая другое имя.

[ и ] начинать и заканчивать «массивы». Массивы могут состоять из чего угодно.

Числа являются «числами». Плавающая точка или иначе.

() и <> начинаются и заканчиваются «строками». <> строки перечислены как шестнадцатеричные значения, () - строки ANSI.

Pet Peeve: / Имена и (Строки) используют совершенно разные системы побега. Grr.

Косвенные ссылки указывают на другие объекты в PDF:
<objNum> <generationNum-AlwaysZero> R

В вышеприведенном примере объекта поток контента находится в объекте 4 в другом месте PDF. Чтобы найти его, вы можете использовать текстовый поиск ваших редакторов для «N 0 obj», где N - номер объекта, который вы хотите.
ВНИМАНИЕ: в PDF есть сотни, возможно, тысячи объектов. Поиск "1 0 obj" даст вам много хитов.

Учитывая, что вы просите увидеть внутреннюю структуру, вы, наверное, уже все это знаете. Другие, желающие узнать то же самое, могут не знать.

ВНИМАНИЕ: НЕ РЕДАКТИРУЙТЕ PDF в текстовом редакторе. Все эти двоичные файлы будут искажены, байтовые смещения очень важны в PDF.

Плагин Acrobat [s]

Есть плагин для акробата, который называется Wind Canack Solutions и называется PDF CanOpener. Это СЛИК. Вы сможете просматривать структуру PDF в виде дерева, просматривать (и изменять) потоки содержимого и т. Д.

Сторонние приложения

Много. Многие люди создают его как часть обучения для анализа PDF или как инструмент отладки. Они довольно удобны.

iText RUPS (часть iText, Java PDF lib, теперь на GitHub)

PDF Object Browser

PDF Vole

Марк Сторер
источник
1
PDF Voleссылка, кажется, теперь не работает ...
DNA
5
+1 для iText RUPS, не совсем дружественный графический интерфейс, но работает, кстати, в настоящее время URL проекта выглядит ( sourceforge.net/projects/itextrups )
Хайме Хаблутцель,
2
iText RUPS был перенесен сюда: github.com/itext/rups
bmaupin
1
Здесь есть копия исходного кода pdfvole: github.com/Rossi1337/pdf_vole
yms
1
Если PDF имеет сжатые потоки данных, утилита командной строки qpdf может декодировать / дефлировать их и записать PDF с более понятным содержимым: `qpdf --decode-level = all --stream-data = uncompress inputfile.pdf extendedfile. pdf
skierpage
7

O2Solutions предлагает совместимую с MS Windows утилиту для просмотра внутренней структуры PDF-документов. Это бесплатно для личного и коммерческого использования.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
источник
4

Вы можете просмотреть внутреннюю структуру PDF в Adobe Acrobat, используя ее Browse Internal PDF Structureкоманду из плагина Preflight:

http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/

Вы также можете использовать коммерческий плагин PDF CanOpener для Acrobat для просмотра структуры объектов или бесплатный PDFedit для декодирования сжатых потоков данных в PDF.

Марк Стивенс
источник
4

PoDoFoBrowser - небольшая бесплатная портативная утилита, которая позволяет не только просматривать внутреннюю структуру PDF, но также экспортировать, импортировать и редактировать данные объекта. Его можно скачать здесь:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

Вот как это выглядит под Windows:

Скриншот

Алексей Попков
источник
2

Бесплатный редактор PDF-XChange имеет панель « Содержимое», которая позволяет просматривать древовидную структуру файла PDF.

View -> Panes -> Content
Хусейн Яглы
источник
2

PDF Vole, кажется, сломан. Если кто-то все еще ищет инструмент, я использую бесплатный PDF Analyzer .

введите описание изображения здесь

ЮФО
источник