Как искать PDF-файлы и извлекать соответствующие страницы с помощью Automator?

0

Я пытаюсь создать рабочий процесс Automator, который позволит мне:

  1. Укажите папку для запуска действий
  2. Поиск всех файлов PDF в этой папке по определенному слову (имя моего клиента)
  3. Создайте новый файл PDF только с теми страницами, на которых отображается имя моего клиента
  4. Сохраните этот файл на рабочем столе

введите описание изображения здесь

Пока что я могу выполнять шаги 1 и 2. Но есть ли способ узнать, на каких страницах были найдены совпадения, или создать новый PDF-файл для соответствующих страниц?

aszekely
источник

Ответы:

1

Я понимаю, что это год после того, как вы задали вопрос, но мне понравился вызов. Итак, в заключение, вот как я бы это сделал ...

  • Для каждого PDF в папке, преобразовать его в текст.
  • Используйте команду perl для поиска по ключевым словам в текстовых файлах и возврата номеров страниц.
  • Используйте инструмент командной строки для извлечения страниц из PDF.
  • Объединить извлеченные страницы.

Вы можете сделать первую часть достаточно легко с appleScript / automator.

Команда perl для получения номеров страниц:

perl -ne 'print "$1$2" if /blah/ .. /--- Page (\d+) ---(\n)/'

Командный инструмент для извлечения страниц из PDF-файла можно найти по адресу users.skynet.be/tools/.

Наконец, объединить отдельные страницы можно с помощью автоматизатора или вышеупомянутых инструментов.

Надеюсь это поможет.

Vic
источник