Когда я хочу найти фрагмент, например searchPart1, какой-нибудь неизвестный текст searchPart2 в текстовом файле, я использую searchPart1.*searchPart2
. Но это невозможно в любом читателе PDF, который я использую. В настоящее время я конвертирую pdf в текстовый файл и открываю его с помощью less
или geany
, а затем использую доступное для него регулярное выражение.
Есть ли Pdf Reader с регулярным выражением поиска, кроме командной строки pdfgrep
pdfgrep
является кузнецом, поэтому он не ответил на вопрос полностью. Для принятия ответа требуется программа для чтения PDF со встроенным pdfgrepОтветы:
В репозиториях pdfgrep не является читателем и требует использования терминала, но устраняет необходимость сначала преобразовывать файл pdf в текстовый файл, а затем открывать его в текстовом редакторе с поддержкой:
В дополнение к функциям, перечисленным в Synaptic, вы можете искать несколько файлов и рекурсивно. Одно большое отличие от обычного
grep
состоит в том, что pdfgrep предоставляет не номера строк, а номера страниц.man pdfgrep
есть детали.Простой пример:
Здесь,
i
для нечувствительности к регистру иn
дает номер страницы, а не номер строки.Пример вывода выглядит так:
Есть короткое видео на YouTube, Pdfgrep - Поиск текста внутри PDF-файлов - также Linux CLI .
источник