Как извлечь аннотации из файлов PDF?

11

Существует ли инструмент командной строки для извлечения аннотаций (комментарии добавлены с использованием evince) из PDF-файлов?

Я ищу такое решение, чтобы отправить людям отзыв о представленных документах. Помимо ответа с аннотированным PDF в качестве вложения, я хочу включить дамп моих комментариев в качестве замены для правильного журнала изменений в теле письма.

В manстраницах инструментов нравится pdftotext, pdftohtmlили pdfinfoя не нашел каких - либо полезных опций.

fheub
источник
Пояснение: я не говорю о комментариях от руки (цифровыми чернилами).
Fheub
1
См. Сценарий python в ответе на этот вопрос stackoverflow.com/questions/1106098/…
mlberlin
@mlberlin спасибо за полезную ссылку! Я не понимаю, почему я не мог найти это сам тогда - но это действительно было очень давно…
Fheub

Ответы:

2

Да; видеть

/programming/1106098/parse-annotations-from-a-pdf

и возможно

https://github.com/measuresforjustice/textricator

(думал, что мы должны вынести этот вопрос из очереди unanswerd)

user1133275
источник
Может ли textricator также обрабатывать аннотации / комментарии из PDF-документов? Примеры и README описывают только обработку «обычного» контента.
Fheub