У меня есть существующий PDF (без какого-либо соответствующего исходного файла) и текстовый файл, который представляет собой список элементов, ссылающихся на разделы в файле PDF, вместе с номером страницы для каждого элемента. Я хотел бы создать новый PDF, который начинается с созданного индекса оглавления, за которым следует содержимое исходного PDF. Сгенерированный индекс должен быть связан с гиперссылкой, чтобы при щелчке по любому элементу автоматически переходила на страницу, содержащую указанный раздел.
Я ищу подходящий набор инструментов (предпочтительно CLI-ориентированных) для выполнения этого в Linux; все инструменты, на которые я смотрел до сих пор, похоже, не предлагают решения. Я опытный программист, и я более чем рад написать код, если потребуется (желательно в Ruby / Python / Perl / shell) для анализа моего текстового файла и преобразования его в индекс с гиперссылкой, но я не могу найти нужные инструменты решить это. Я думаю, что часть проблемы заключается в том, что гиперссылки должны указывать на один и тот же файл, но их цели не будут существовать до тех пор, пока ToC не будет объединен с исходным PDF.
Я также знаком с различными языками разметки, например Markdown, reStructuredText, TeX, LaTeX, org-mode, и идеальное решение будет использовать один из них в качестве промежуточного шага для создания гиперссылки ToC.
Ответы:
В целом это взято из @Herbert, отвечающего на очень похожий вопрос о TeX StackExchange:
Добавление оглавления в существующий PDF
используйте пакет
pdfpages
и затем:источник