Как я могу эффективно обнаружить все пустые страницы в PDF?

-1

Мое текущее решение - открыть «панель миниатюр страниц слева» и найти пустые страницы. Что является более эффективным решением, начиная с этого поста за июль 2015 года ?

Я не спрашиваю об удалении пустых страниц автоматически; Я должен проверить себя, если страницы пустые перед удалением.

Греческий - территория 51 предложение
источник
Вы можете ускорить ручной процесс, отображая сетку миниатюр страниц, скажем, сетку 5 х 10, чтобы вы могли видеть 50 страниц за раз. Это займет всего несколько секунд, чтобы просмотреть их и удалить пробелы.
fixer1234
@ fixer1234 Спасибо. Я обновил свой пост, чтобы уточнить.
Греческий - Предложение для области 51

Ответы:

2

Для начала довольно сложно определить, является ли страница пустой. Например, могут быть объекты, видимые за пределами выбранного вами окна PDF (например, метки обрезки), или слои объектов, которые можно включить / выключить условно.

Для программного решения вы могли бы либо

  • используйте библиотеку, например, PoDoFoчтобы загрузить рассматриваемый PDF-файл в память, проанализировать каждый поток объекта страницы и найти любые команды рисования / встроенные объекты XObject.

  • или (в MacOS) используйте CGContextDrawPDFPage(Core Graphics) для рендеринга каждой страницы (с низким разрешением, как должно быть 72dpi), и для сканирования на полученном изображении небелых пикселей.

JVB
источник