Разделение страницы PDF на две части

36

У меня есть файл PDF, который был результатом сканирования книги.

В этом файле 2 страницы книги соответствуют 1 в PDF. Поэтому, когда я вижу страницу в файле PDF, я на самом деле вижу 2 страницы книги.

введите описание изображения здесь

( оригинал )

Я хотел бы знать, есть ли какой-либо способ преобразовать этот файл в другой PDF, где 1 страница книги соответствует 1 странице PDF, то есть нормальной ситуации.

pdf JGNog
источник

27

Попробуйте Gscan2pdf , который вы можете загрузить из Центра программного обеспечения или установить из командной строки sudo apt-get install gscan2pdf.

Открыть Gscan2Pdf:

файл> импортировать файл PDF;

Теперь у вас есть одна страница (см. Левую колонку):
затем инструменты> очистить ;
выберите double как layout и #output pages как 2 , затем нажмите OK ;
Gscan2pdf разбивает ваш документ (помимо прочего, он также очищает его, выравнивает и т. Д.) Теперь у вас есть две страницы:
Сохраните файл PDF, если вы удовлетворены результатом.

Вениамин
источник

Я искал более простой способ использовать unpaper без необходимости создавать ppm-файлы, и это все. Очень полезный ответ.

Делать

7

Для будущих читателей: это не делает то, что вы хотите с PDF-файлами без изображений - импортируются только изображения. gscan2pdf отлично подходит для сканирования :).

Эндрю Айлетт

32

Вы можете использовать mutool, а MuPDF инструмент командной строки ( sudo apt-get install mupdf-tools):

mutool poster -x 2 input.pdf output.pdf

Вы также можете использовать, -yесли вы хотите выполнить вертикальное разделение.

Peque
источник

5

В Ubuntu 16.04 имя пакета mupdf-tools(так .. sudo apt-get install mupdf-tools).

franzlorenzon

Супер полезный пакет, о котором я раньше не знал. Благодарность!

Дай

1

Сделали работу очень хорошо и очень быстро! К сожалению, я не смог найти способ использовать его для удаления первой пустой страницы из выходного PDF.

Мартин Шаррер

@MartinScharrermutool clean input.pdf output.pdf 2-N

Пек,

12

Я бы использовал Briss . Это позволяет вам выбирать различные области каждой страницы, каждая из которых превращается в новую страницу.

введите описание изображения здесь

радостный
источник

1

Я принял ответ от Бенджамина, а не от тебя просто потому, что Брисс еще не созрел. Я попробовал Briss, и это выглядит хорошо. Но установка gscan2pdf намного быстрее и чище. В любом случае, спасибо за ваш вклад!

JGNog

1

Я использую Briss уже больше года. Кажется, достаточно зрелым для меня.

радостный

Это потрясающе

user2413

2

Другим вариантом является ScanTailor . Эта программа особенно хорошо подходит для обработки нескольких сканов одновременно.

apt-get install scantailor

К сожалению, он работает только при вводе файлов изображений, но достаточно просто конвертировать отсканированный PDF в jpg. Вот одна строка, которую я использовал для преобразования целого каталога PDF-файлов в jpgs. Если PDF имеет n страниц, он создает n jpg файлов.

for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;

У меня были скриншоты, готовые поделиться, но у меня недостаточно представителей, чтобы опубликовать их.

ScanTailor выводит в tif, поэтому, если вы хотите, чтобы файлы вернулись в PDF, вы можете использовать это, чтобы сделать PDF для каждой страницы.

for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;

Затем вы можете использовать этот однострочник или приложение, такое как PDFShuffler, чтобы объединить любой или все файлы в один PDF.

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf

Curtis
источник

1

Вот скрипт Python для этого.

https://gist.github.com/tshrinivasan/23d8e4986cbae49b8a8c

tshrinivasan
источник

0

Сейда может сделать это, используя свой веб-интерфейс или интерфейс командной строки (с открытым исходным кодом). Задача называетсяsplitdownthemiddle

Андреа Вакондио
источник

0

Вы можете использовать Okular или любой PDF-ридер, а затем использовать печать для файла и выберите параметры и копии-> страниц. Выберите интересующие вас страницы и распечатайте их. Это будет вырезать выбранные страницы. Просто и легко!

Knight71
источник

Легко для одной страницы, но совершенно бесполезно для пакетной работы.

JayEye

0

Решение командной строки с использованием ImageMagick:

Разделите PDF на отдельные изображения:
```
convert -density 300 orig.pdf page.png
```
Разделите изображения каждой страницы на левое и правое изображение:
```
for file in page-*.png;
  do convert "$file" -crop 50%x100% "$file-split.png";
done
```

Переименуйте page-###-split-#.pngфайлы в просто 001.pngи 002.pngт.д .:

ls page-*-split-*.png | cat -n | 
  while read n f; do mv "$f" $(printf "%03d.png" $n); done

Снова объедините полученные изображения страниц в PDF:
```
convert ls -l [0-9][0-9][0-9].png result.pdf
```

Источники: (также включая варианты и дополнительные советы)

Обрезать и разделить сканирование книги по 3 командам , здесь изменено использование forкоманды цикла для предотвращения проблем с памятью.
Ответ: Переименование файлов в папке с последовательными номерами вместе с этим комментарием
Ответ: ImageMagick: конвертирование завершается после нескольких страниц , если вы работаете с ограничениями памяти ImageMagick (что я и сделал).

tanius
источник

-2

Есть замечательная программа сканкромсатор. Это бесплатно и хорошо работает через вино. Больше информации здесь .

oromay
источник

Разделение страницы PDF на две части

Ответы: