У кого-нибудь есть какие-либо рекомендации или процедуры для восстановления поврежденного PDF? Когда я открываю файл, я получаю сообщение «Произошла ошибка при открытии этого документа. Файл поврежден и не может быть восстановлен». Кажется, существует множество инструментов, но ни один из них я бы не назвал заслуживающим доверия. Есть ли какие-либо решения на основе Linux с открытым исходным кодом для этого, возможно?
pdf
repair
ghostscript
Тим Александр
источник
источник
Ответы:
Ghostscript восстановит ваш поврежденный PDF-файл автоматически ... если он может открыть его в первую очередь (то есть, если он не поврежден без возможности восстановления). Но после этого вам все равно придется перепроверить результат ...
В Linux попробуйте эту команду:
В Windows попробуйте это:
источник
У меня был поврежденный PDF-файл,
print.pdf
который Ghostscript не мог открыть, но обычные графические программы просмотра PDF для Linux (Okular, Evince) открылись нормально. (В моем случае, файл имел мусор в начале вместо заголовка PDF, когда открывался в шестнадцатеричном редакторе.)Эти средства просмотра PDF используют Poppler в качестве внутреннего рендера PDF. Таким образом, вы можете восстановить PDF, используя инструменты командной строки Poppler. В Ubuntu они есть в
poppler-utils
пакете. Я использовал:который сгенерировал файл PDF с правильными заголовками, какие инструменты, такие как Ghostscript, теперь приняты.
источник
mutool
( страница проекта , man-страница ) будет восстанавливать поврежденные PDF-файлы без их распечатки .sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf
Кроме того, есть несколько инструментов и структур, которые могут разбивать / декомпилировать PDF-файлы в их компоненты без их рендеринга. Они могут быть полезны для извлечения текста, сценариев и изображений. Посмотрите этот ответ для списка таких инструментов: https://reverseengineering.stackexchange.com/q/1526/8210 . Например, вы можете попробовать текущий топ-ответ Origami , у него есть просмотрщик на основе GTK.
источник
mutool clean
не исправить все возможные ошибки. У меня есть файл с различными ошибками в шрифтах и потоках контента, и mutool сохранит эти ошибки.У меня был поврежденный pdf-файл, потому что php-файл, используемый для его загрузки, отражал некоторые ошибки (в HTML) и символы NUL в конце.
Решением было открыть PDF-файл с помощью Notepad ++ и удалить весь текст после строки
источник
%%EOF
. Я удалил все после первого%%EOF
использования шестнадцатеричного редактора. Теперь все работает отлично.