Обычно я использую Notepad ++ для поиска в файлах с помощью регулярных выражений. Сегодня мне интересно, есть ли программа PDF, которая делает то же самое для PDF-файлов. Конечно, я мог бы конвертировать PDF в текст и использовать Notepad ++, но есть ли более простой способ без конвертации?
15
Ответы:
несколько вариантов:
источник
Как вы сказали, очевидной альтернативой является преобразование PDF в текст. Один из способов для программиста настроить его для массовой обработки - использовать пакет Python PDFMiner. Агент Ransack использует «pdftotext» из проекта Xpdf (и вы тоже можете).
источник