У меня есть отсканированный курс, и он состоит из двух страниц, которые отображаются последовательно как одна страница, как я могу автоматически разделить все страницы за один проход. Обычно это делается путем обрезки нечетных и четных страниц, а затем их объединения, но это может занять очень много времени?
Как разделить страницы на отсканированном PDF за один проход?
pdf
adobe-acrobat
Эдуард Флоринеску
источник
источник
Есть отличный, бесплатный инструмент с открытым исходным кодом под названием Briss . Это очень просто, удобно и эффективно. Он работает на нескольких операционных системах через Java.
Загрузите ваш PDF в приложение. Приложение сгруппирует похожие страницы и положит их друг на друга. Нарисуйте прямоугольники поверх ваших страниц, чтобы они покрывали то, что вы хотите включить. Это будет выглядеть так:
Даже если ваш PDF имеет несколько категорий макета в одном документе, Briss справится с этим. Например, скажем, некоторые части в портретной, а другие в альбомной. Briss сгруппирует их по разным категориям и позволит вам нарисовать на них разные прямоугольники, а затем обработать все это за один проход в один документ. Брисс очень хорошо решает, какие страницы должны быть сгруппированы. Как правило, у меня уходит меньше минуты ручной работы, чтобы начать работу с Бриссом. Таким образом, документ за сотни или даже тысячи страниц может быть сделан за пару минут благодаря этой замечательной программе.
Когда все выглядит хорошо, выберите « Действие» , затем « Обрезать PDF» .
Поистине очень аккуратный инструмент.
Примечание: я понимаю, что этот ответ звучит так, будто я разработчик Briss или что-то в этом роде, но на самом деле это не так Я просто люблю инструмент.
источник
Sejda.com может разделить отсканированные документы PDF пополам , посередине. Работает на всех настольных платформах.
Вот кратко как:
Если это отсканированный буклет, и страницы уже не в своем естественном порядке, он также может изменить их порядок для вас.
Я разработчик проекта. Открытый исходный код .
источник
Вы можете использовать MuPDF «S
mutool
:источник
Есть две проблемы с автоматизацией разделения отсканированных книг за один проход:
Для всего, что связано со сканированными книгами, я настоятельно рекомендую использовать ScanTailor . Он имеет такие функции, как:
Смотреть учебное видео ≫
Вы должны экспортировать PDF в изображения, чтобы использовать это, и рекомбинировать выходные изображения обратно. Обработанные изображения могут быть очень маленькими по размеру файла (до 6% от исходного), но отличного качества.
Из своего GitHub :
Также есть форк: ScanTailor Advanced
Чтобы выполнить задачу удовлетворительно, я рекомендую вам использовать PDF-Xchange Viewer для извлечения изображений и добавления OCR, i2pdf для объединения выходов. По моему опыту, вы можете установить самое низкое качество JPG, и оно не будет сильно отличаться, но у вас есть компромисс между размером конечного результата и качеством изображения. Все программы бесплатны. Весь процесс занимает около 1 часа в фоновом режиме, с периодическими проверками.
У меня также есть полное руководство по обработке отсканированных книг, вы можете проверить его: полное руководство по обработке отсканированных книг .
К вашему сведению: Как создавать иерархические закладки на отсканированных файлах PDF?
источник