Как проиндексировать PDF-документ?

11

Я читаю PDF-документ в Ubuntu 11.04, используя «Средство просмотра документов» по ​​умолчанию. Документ содержит более 500 страниц, и требуется некоторое время, чтобы выполнить «Найти ...» для определенного текста. Есть ли способ индексировать PDF документы на вышеупомянутой платформе? Я ищу функциональность, встроенную в сам ридер.

Правин Срипати
источник

Ответы:

1

Я не уверен, что кто-либо из читателей PDF поддерживает индексирование текста - возможно, потому что само индексирование было бы довольно дорогим, а файлы PDF открывались и закрывались «ad-hoc»

Тем не менее, я провел некоторое тестирование и вижу, что okular - средство просмотра по умолчанию из KDE - выполняет поиск намного быстрее, чем evince (средство просмотра по умолчанию из Ubuntu). Т.е. Окулар может сканировать весь 500-страничный документ, может быть, за секунду, в то время как evince тратит ~ 5 секунд на ту же задачу.

Вы можете установить его, набрав

sudo apt-get install okular 

(или просто найдите его в Центре программного обеспечения )

если это первая программа KDE на вашем компьютере, для этого потребуется установить довольно много зависимостей, но это может стоить того - я считаю, что программы KDE в целом более способны, чем их аналоги из Gnome ... Okular поддерживает аннотации в pdf, для пример, который также иногда полезен.

Сергей
источник
Сергей - Я использую гном. Как вы упомянули, нужно также установить множество зависимостей kde. Насколько рискованно устанавливать зависимости kde? Я не хочу снова сталкиваться с проблемой установки всей ОС. Спасибо за помощь.
Правин Срипати
Это примерно так же рискованно, как переходить дорогу - миллионы людей делают это каждый день, но есть небольшая вероятность, что что-то может пойти не так - как при установке любого другого программного обеспечения. На самом деле, я думаю, что даже совершенно нормально, чтобы рабочие столы Gnome, KDE и XFCE устанавливались одновременно и переключались между ними ...
Сергей
Спасибо, Сергей - Okular - это круто, функция аннотаций действительно хороша.
Правин Срипати
@PraveenSripati, если вы беспокоитесь о зависимостях Okular, вы можете попробовать qpdfview. Пожалуйста, смотрите мой ответ ниже для более подробной информации.
Glutanimate
3

Трекер может индексировать ваши документы PDF. Это очень быстро и надежно.

Если вы еще не используете этот замечательный инструмент, вы можете настроить его так, чтобы он индексировал только ваши PDF-документы: Alt+, F2затем вставьте, tracker-preferencesперейдите в «Locations» и выберите папку вашего PDF.

desgua
источник
1

Альтернативный просмотрщик PDF


обзор

Qpdfview Очень легкая и быстрая альтернатива Okular, не имеющая никаких зависимостей от KDE . Он все еще находится в бета-версии, но я обнаружил, что он так же стабилен, как и его крупные аналоги. Производительность поиска фантастическая и, по крайней мере, на одном уровне с Okular.

Установка

Qpdfview еще не доступен в официальных репозиториях, но его можно легко установить из PPA разработчика, набрав:

sudo add-apt-repository ppa:b-eltzner/qpdfview && apt-get update
sudo apt-get install qpdfview

Индексирование PDF


обзор

Я не смог найти альтернативу возможностям индексирования Adobe Acrobat в Linux, и похоже, что встроенные индексы все еще не являются частью открытых стандартов PDF .

Тем не менее, существует ряд очень мощных настольных поисковых систем, которые быстрее и эффективнее индексируют PDF, чем проприетарные инструменты Adobe. Трекер уже упоминался, но есть и другие приложения. Вы можете найти очень тщательное сравнение здесь .

Glutanimate
источник