Оптимизация поиска Google Mini для PDF

1

У меня это работает само по себе, но, возможно, я выбрал не тот инструмент для этой работы.

В основном у нас есть электронные копии многочисленных книг, связанных с нашей отраслью.

Что я хотел сделать, так это создать поисковый указатель этих книг.

К сожалению, многие книги превышают предел индексации размера файла 30 МБ, поэтому они даже не индексируются. (Я думаю, что есть конфигурация, чтобы изменить это?)

Тем, кто это делает, я могу искать их, находить их и связывать непосредственно с ними ... Но после нажатия на ссылку загружается весь PDF-файл, и он отображает PDF-файл, начиная со страницы 1, а не со страницы поиска условия были найдены на.

Любые предложения или советы о том, как подойти к этому проекту? Я полностью открыт ...

Я думаю, что первый вопрос: «Должен ли я вообще пытаться адаптировать материалы / Google Mini для работы в этом сценарии?» и если да, то "какой подход лучше?"

Графы
источник

Ответы:

1

Я бы, вероятно, держался подальше от подхода Google Mini к этому и посмотрел бы на получение некоторого программного обеспечения для управления контентом онлайн. Я лично люблю издание сообщества Alfresco. Это может быть немного слишком высокого класса для вашего приложения, хотя.

ErnieTheGeek
источник
0

Не уверен, поможет ли вам этот ответ. Но здесь это идет:

Acrobat Pro, а также Acrobat Reader (даже в Linux) предлагают некоторые «параметры командной строки PDF open». Они определяют, как именно открывается документ (какая страница, какой уровень масштабирования и т. Д.).

Одна из поддерживаемых функций - открыть PDF-файл с открытым диалоговым окном поиска и соответствующими поисковыми словами. Примеры:

Acrobat и Acrobat Professional для Windows:

 acrobat.exe ^
   /a #search="superuser basketball supermodels" ^
   "d:\path\to\example.pdf"

Acrobat Reader в Windows:

 acrord32.exe ^
   /a #search="PDF computing searching" ^
   "d:\path\to\example.pdf"

Acrobat Reader для Linux: *

 acroread \
   /a #search="stackexchange football girls" \
   "/path/to/example.pdf"

На веб-сайте Adobe выполните поиск «Параметры открытия PDF», чтобы найти руководство в формате PDF, содержащее все подробности об этой функции ....

Курт Пфайфл
источник
0

Моим решением было разделить PDF-файлы на отдельные страницы. Это работает для меня, потому что я ищу и обслуживаю справочные материалы, например, словарь.

Если пользователь хочет знать определение «яблока», то поиск «apple» вернет одну страницу PDF, на которой появятся слово и определение «яблока». Это все, что пользователь хочет знать.

Это не сработает так хорошо, если абзац будет занимать несколько страниц - хотя, если ваши PDF-файлы не превышают 2,5 МБ, вы можете «упаковать» любое количество страниц в один PDF-файл.

Графы
источник