Из того, что я прочитал, кажется, что вы должны использовать Solr для индексирования вложений PDF и Word и их возвращения в поиск. У меня есть Solr, работающий с Drupal, но я думаю, что мне нужно, чтобы Тика работала над Solr для индексирования документов. Для Тики очень мало документации. Кто-нибудь знает, где хороший источник для этого? Есть ли лучший / более простой способ поиска в индексных документах Drupal?
9
Ответы:
Чтобы помочь вам, у вас есть этот хороший модуль Apache Solr Attachments . Если вы загрузите модуль, у вас будет файл README.txt, который даст вам некоторые подсказки, как помочь вам установить и настроить Tika.
источник
Раньше мы с успехом использовали файлы поиска , но я думаю, что в прошлый раз мы использовали его два года назад. Обратите внимание, что существуют требования на стороне сервера для исполняемых файлов для выполнения поиска, и что нет доступной версии Drupal 7.
источник
Я обнаружил Search File Attachments , который поддерживает как Drupal 7/8, так и различные типы файлов.
источник