Как искать в PDF, используя регулярные выражения?

15

Обычно я использую Notepad ++ для поиска в файлах с помощью регулярных выражений. Сегодня мне интересно, есть ли программа PDF, которая делает то же самое для PDF-файлов. Конечно, я мог бы конвертировать PDF в текст и использовать Notepad ++, но есть ли более простой способ без конвертации?

Майкл С.
источник
1
Какую ОС вы используете?
Скотт МакКленнинг
Windows Developer Preview и Windows 7
Майкл С.

Ответы:

9

несколько вариантов:

Акира
источник
1
@akira А как насчет Linux?
Нихил
4
  1. Агент Ransack является бесплатным (облегченным) и поддерживает PDF, как подтверждают его заметки о выпуске.
  2. PowerGREP является коммерческим продуктом.

Как вы сказали, очевидной альтернативой является преобразование PDF в текст. Один из способов для программиста настроить его для массовой обработки - использовать пакет Python PDFMiner. Агент Ransack использует «pdftotext» из проекта Xpdf (и вы тоже можете).

minopret
источник
Sidenote: Агент Ransack облегченная версия FileLocator
Акира
Благодарность! Я посмотрел повнимательнее. Замечания к выпуску производителя подтверждают, что File Locator Lite, также известный как Agent Ransack, поддерживает PDF. Редактирование моего ответа.
минопрет
Агент Рансак делает работу. Вы также можете попробовать DnGrep.
Майкл С.