Разделение страницы PDF на две части

36

У меня есть файл PDF, который был результатом сканирования книги.

В этом файле 2 страницы книги соответствуют 1 в PDF. Поэтому, когда я вижу страницу в файле PDF, я на самом деле вижу 2 страницы книги.

введите описание изображения здесь

( оригинал )

Я хотел бы знать, есть ли какой-либо способ преобразовать этот файл в другой PDF, где 1 страница книги соответствует 1 странице PDF, то есть нормальной ситуации.

JGNog
источник

Ответы:

27

Попробуйте Gscan2pdf , который вы можете загрузить из Центра программного обеспечения или установить из командной строки sudo apt-get install gscan2pdf.

Открыть Gscan2Pdf:

  1. файл> импортировать файл PDF;

    импорт

    Теперь у вас есть одна страница (см. Левую колонку):

    не замужем

  2. затем инструменты> очистить ;

    убирать

  3. выберите double как layout и #output pages как 2 , затем нажмите OK ;

    Трещина

  4. Gscan2pdf разбивает ваш документ (помимо прочего, он также очищает его, выравнивает и т. Д.) Теперь у вас есть две страницы:

    двойной

  5. Сохраните файл PDF, если вы удовлетворены результатом.
Вениамин
источник
Я искал более простой способ использовать unpaper без необходимости создавать ppm-файлы, и это все. Очень полезный ответ.
Делать
7
Для будущих читателей: это не делает то, что вы хотите с PDF-файлами без изображений - импортируются только изображения. gscan2pdf отлично подходит для сканирования :).
Эндрю Айлетт
32

Вы можете использовать mutool, а MuPDF инструмент командной строки ( sudo apt-get install mupdf-tools):

mutool poster -x 2 input.pdf output.pdf

Вы также можете использовать, -yесли вы хотите выполнить вертикальное разделение.

Peque
источник
5
В Ubuntu 16.04 имя пакета mupdf-tools(так .. sudo apt-get install mupdf-tools).
franzlorenzon
Супер полезный пакет, о котором я раньше не знал. Благодарность!
Дай
1
Сделали работу очень хорошо и очень быстро! К сожалению, я не смог найти способ использовать его для удаления первой пустой страницы из выходного PDF.
Мартин Шаррер
@MartinScharrermutool clean input.pdf output.pdf 2-N
Пек,
12

Я бы использовал Briss . Это позволяет вам выбирать различные области каждой страницы, каждая из которых превращается в новую страницу.

введите описание изображения здесь

радостный
источник
1
Я принял ответ от Бенджамина, а не от тебя просто потому, что Брисс еще не созрел. Я попробовал Briss, и это выглядит хорошо. Но установка gscan2pdf намного быстрее и чище. В любом случае, спасибо за ваш вклад!
JGNog
1
Я использую Briss уже больше года. Кажется, достаточно зрелым для меня.
радостный
Это потрясающе
user2413
2

Другим вариантом является ScanTailor . Эта программа особенно хорошо подходит для обработки нескольких сканов одновременно.

apt-get install scantailor

К сожалению, он работает только при вводе файлов изображений, но достаточно просто конвертировать отсканированный PDF в jpg. Вот одна строка, которую я использовал для преобразования целого каталога PDF-файлов в jpgs. Если PDF имеет n страниц, он создает n jpg файлов.

for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;

У меня были скриншоты, готовые поделиться, но у меня недостаточно представителей, чтобы опубликовать их.

ScanTailor выводит в tif, поэтому, если вы хотите, чтобы файлы вернулись в PDF, вы можете использовать это, чтобы сделать PDF для каждой страницы.

for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;

Затем вы можете использовать этот однострочник или приложение, такое как PDFShuffler, чтобы объединить любой или все файлы в один PDF.

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf

Curtis
источник
0

Вы можете использовать Okular или любой PDF-ридер, а затем использовать печать для файла и выберите параметры и копии-> страниц. Выберите интересующие вас страницы и распечатайте их. Это будет вырезать выбранные страницы. Просто и легко!

Knight71
источник
Легко для одной страницы, но совершенно бесполезно для пакетной работы.
JayEye
0

Решение командной строки с использованием ImageMagick:

  1. Разделите PDF на отдельные изображения:

    convert -density 300 orig.pdf page.png
    
  2. Разделите изображения каждой страницы на левое и правое изображение:

    for file in page-*.png;
      do convert "$file" -crop 50%x100% "$file-split.png";
    done
    
  3. Переименуйте page-###-split-#.pngфайлы в просто 001.pngи 002.pngт.д .:

    ls page-*-split-*.png | cat -n | 
      while read n f; do mv "$f" $(printf "%03d.png" $n); done
    
  4. Снова объедините полученные изображения страниц в PDF:

    convert ls -l [0-9][0-9][0-9].png result.pdf
    

Источники: (также включая варианты и дополнительные советы)

tanius
источник
-2

Есть замечательная программа сканкромсатор. Это бесплатно и хорошо работает через вино. Больше информации здесь .

oromay
источник