Там xpdf, который включает в себя pdftotext
двоичный файл.
Pdftotext преобразует файлы Portable Document Format (PDF) в обычный текст.
На Linux доступен установщик. Кажется, что это также входит в poppler-utils
пакет. На OS X вы можете установить его, используя Homebrew (сначала установите его), а затем использовать
brew install homebrew/x11/xpdf
который загрузит исходные файлы и скомпилирует его для OS X. После этого просто используйте его так:
pdftotext your_pdf_file.pdf
который сгенерирует простой текстовый файл. Есть также несколько вариантов, проверьте man pdftotext
для более подробной информации.
Альтернативой является poppler , в OSX:
brew install poppler
в Debian и друзья
apt-get install poppler-utils
brew install homebrew/x11/xpdf
brew install Caskroom/cask/pdftotext
Хорошим инструментом для Windows является A-PDF Text Extractor
источник