Есть ли инструменты для обрезки полей PDF?

44

У меня есть электронная книга, которую я пытаюсь прочитать в формате PDF на Kindle. К сожалению, верхние и нижние колонтитулы страниц имеют некоторый контент (соответственно, номер страницы и информацию об авторских правах), не позволяющие устройству масштабировать фактический текст в соответствии с его областью просмотра полезной области, в результате чего фактический контент слишком мал для чтения.

Доступны различные инструменты, которые удаляют пробелы, но Kindle уже делает это; моя цель, напротив, состоит в том, чтобы удалить печатные материалы за пределами определенной ограничительной рамки, и единственный инструмент, который я нашел для этой цели, - это умеренно дорогое коммерческое программное обеспечение.

Я мог бы, вероятно, создать маску в Inkscape; разделите отдельные страницы с помощью pdftk, примените маску к каждой странице по отдельности (вывод в postscript) и объедините многочисленные файлы postscript в один PDF. Тем не менее, эти шаги декодирования / перекодирования были бы весьма неудачными с точки зрения размера документа; что-то, способное работать с немного большей утонченностью, было бы идеально.

У меня есть под рукой все основные операционные системы (Windows, несколько современных дистрибутивов Linux, Mac и т. Д.), Поэтому решения не должны ограничиваться платформой.

Предложения?

(Я сообщил об этой проблеме автору, который упомянул об этом своему редактору, который ничего не делал по этому вопросу в течение более месяца, делая подход с нулевой работой, очевидно, непродуктивным).

Чарльз Даффи
источник

Ответы:

45

Попробуйте BRISS . Бесплатный, с открытым исходным кодом и кроссплатформенный. Это хорошее обсуждение на форумах MobileRead .

радостный
источник
4
Это прекрасный кусок программного обеспечения; Благодарность!
Чарльз Даффи
1
Нереальный! отличная программа
Фидель
Открыл pdf, он автоматически выбрал область обрезки, сохранил в новый файл с добавлением _cropped к имени файла, в основном я ничего не сделал - классное приложение!
Раш Фрисби
Этот инструмент сохраняет всю векторную графику PDF ==> Увеличение работает так же, как и перед кадрированием. Именно то, что мне было нужно.
килтек
1
Briss превосходен тем, что работает автоматически и почти всегда хорошо работает. На компьютерах с Linux вы можете получить результат одной короткой командой за несколько секунд с помощью «briss myfile.pdf». Просто добавьте следующую строку в файл ~ / .bashrc, адаптировав его к установочному каталогу briss: briss () {java -jar ~ / bin / briss-0.9 / briss-0.9.jar -s "$ 1"; }
dominecf
10

Как уже упоминалось в другом ответе, BRISS великолепен. Другой действительно удобный инструмент - k2pdfopt ( http://www.willus.com/k2pdfopt/ ). Этот инструмент действительно хорош, чтобы взять PDF и оптимизировать их для Kindle (или любого устройства с меньшим экраном). Он отлично работает для научной статьи в 2 колонки, поскольку он переформатирует текст, сохраняя при этом уравнение и изображения.

Жан-Филипп Жодойн
источник
4

Как уже отмечалось, k2pdfopt - отличный инструмент.

Если вы не против джейлбрейка вашего Kindle (и, возможно, аннулирования гарантии), есть также возможность использовать этот инструмент прямо на вашем ридере. Это реализуется тремя вилками одного и того же программного пакета:

  • Kindle PDF Viewer является оригинальным и поддерживает Kindles with Keyboard (разработан для Kindle 3).
  • Kindle Open Reader поддерживает сенсорные устройства (Kindles и недавно также Kobo)
  • Librerator поддерживает Kindles без касания (включая Kindle 4)

Они работают с несколькими столбцами, позволяют переформатировать текст и изменять размер шрифта. Они даже умудряются не разрушать научные формулы и изображения при оплавлении.

В настоящее время существуют небольшие проблемы, такие как отсутствие пробелов между двумя словами перехода на новую строку, но я считаю их беспроблемными. Возможно они исправлены в одной из следующих версий.

Тим
источник
3

Вы можете использовать ScanTailor для более мощного инструмента. Этот инструмент не только автоматически обрезает поля, но и может добавить больше (в случае, если кто-то придет к этому вопросу для последнего). Ниже приводится содержание его вики - страницы Макет страницы :


На этом этапе вы можете настроить поля, добавленные в поле содержимого. Есть два типа полей - жесткий и мягкий.

Жесткая граница - это то, что между сплошными линиями. Они устанавливаются пользователем. Вы можете перемещаться по любой сплошной линии, будь то внутренний или внешний край, или устанавливать поля через числовые значения.

Мягкое поле - это то, что между сплошной и пунктирной линией. Эти поля автоматически добавляются, чтобы размер страницы соответствовал размеру других страниц. Если вы видите пунктирную линию - это означает, что где-то в проекте есть страница с этой шириной (полезная область Hard + margin) и (возможно, другие) с этой высотой.

Это одна большая страница, вызывающая мягкие поля на всех других страницах, хотя бы для того, чтобы не выравнивать их.

Опциональное выравнивание точно определено, добавьте мягкое поле и, если вы добавите, то с любой из частей.

Ooker
источник
Похоже, что это не работает для файлов PDF
Алексей
Ну да, сначала нужно экспортировать его в изображения
Ooker
А затем конвертировать их обратно в PDF. Это излишне, особенно для PDF-файлов с сотнями страниц, таких как книги и учебники.
Алексей
@Oleksiy ну, перебор или нет, зависит от ваших потребностей. Если вам просто нужен Блокнот, тогда Word, безусловно, является излишним. Но потом некоторые люди понимают, что Блокнот им не подходит. Мне нужен этот инструмент из-за необходимости иметь дело с книгами и учебниками
Ooker
1

У меня тоже была эта проблема с моим отсканированным (не англоязычным) PDF файлом на 1200 страниц. Все инструменты, включая Adobe Acrobat (с IX по XI), не смогли обрезать окружающее пустое пространство. Поля нечетной страницы отличались от полей четных страниц. Что еще хуже, размер поля был непоследовательным. Как заметил @frabjous , Брисс помог. Однако, когда все страницы в документе были перекрыты, было отмечено, что обрезка не может быть применена, так как не было общего эффективного пустого пространства вообще (из-за непостоянных полей)

Тогда единственным решением для меня было разделить документ PDF на отдельные страницы, запустить его через Briss, чтобы удалить поля и рекомбинировать. Шаги, которые я выполнил:

  1. Я разделил этот документ на отдельные страницы с помощью Adobe Acrobat IX, щелкнув по Document->Split documentкоторому открылось следующее диалоговое окно: введите описание изображения здесь Это действие создало 1200 отдельных файлов PDF.
  2. Затем я создал командный файл со следующим содержимым:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Поместите этот пакетный файл в то же место, где размещены 1200 PDF-файлов, и запустили пакетный файл.
  4. Я снова использовал Adobe Acrobat IX, чтобы объединить все файлы PDF в один файл, и вот, у меня был PDF со всеми страницами с минимальными белыми полями, который теперь было чертовски легко прочитать на планшете.

Совет: В вышеупомянутом содержимом командного файла я в основном запускаю FORцикл, беру каждый PDF-файл и передаю его Briss для автоматической обрезки PDF-файла. В зависимости от

  1. где установлен Briss (и архитектура компьютера т.е. x86 или x64).
  2. где установлена ​​среда выполнения Java.
  3. Среду выполнения Java можно скачать бесплатно здесь
Нарайанан
источник
1

Чтение PDF-файлов на Kindle не является идеальным. Идеальный способ - конвертировать файлы PDF в формат, который Kindle распознает, используя MobiCreator для преобразования файлов PDF в файлы .prc для Amazon Kindle.

1. Загрузите и установите полную версию Mobipocket Creator по ссылке ниже. (Если вы выберете более простую версию, у нее не будет опции преобразования PDF.)

http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN

2. Когда Mobipocket Creator работает, выберите Adobe PDF в разделе «Импорт из существующего файла».

3. Выберите файл PDF, который вы хотите конвертировать

4. Оставьте остальные в покое, если вы не хотите изменить папку назначения и нажмите «Импорт».

5. Выберите только что созданный html-файл и нажмите «Построить» на панели инструментов в верхней части Mobipocket Creator.

6. Нажмите Build (вы, скорее всего, получите несколько ошибок, но я их просто проигнорирую)

7. Перейдите в папку назначения, откройте папку, созданную с вашей публикацией

8. Скопируйте файл .prc в папку «Документы» на Kindle с помощью USB-кабеля (если вы хотите, чтобы он был доставлен по беспроводной сети, вам придется отправить его себе по электронной почте и заплатить 10 центов)

Одной из основных трудностей чтения PDF-файлов на Kindle является отсутствие оглавления, поэтому вы не можете легко пропустить его.

Однако в Mobipocket Creator есть функция для создания оглавления.

Саймон
источник
Устройство на самом деле Kindle DX; он имеет иметь встроенный считыватель PDF, и достаточно большой формат , что мои документы в порядке с их поля обрезаны.
Чарльз Даффи
@CharlesDuffy Хорошо, тогда меньше хлопот. Спасибо за информирование меня, надеялся, что это сработало
Саймон