Инструмент командной строки для поиска файлов DOCX

9

Существует ли инструмент командной строки для текстового поиска файла docx? Я пытался grep, но он не работает с DOCX, хотя он прекрасно работает с файлами TXT и XML. Я мог бы сначала конвертировать docx в txt, но я бы предпочел инструмент, который работает непосредственно с файлами docx. Мне нужен инструмент для работы под Cygwin.

OP edit: Позже я узнал, что самый простой способ получить grep - это на самом деле преобразовать эти docx в txt, а затем grep поверх них.

Gob00st
источник
Связанный ответ stackoverflow .
jw013
Я избавился от части DOS, так как это здесь не по теме
Майкл Мрозек
Связанный: Полнотекстовая индексация для командной строки?
Жиль "ТАК - перестань быть злым"

Ответы:

3

Я знаю несколько инструментов индексирования, которые поддерживают документы Word. Такие инструменты позволяют индексировать документы, а затем эффективно искать слова в индексе. Они не разрешают полнотекстовый поиск.

Жиль "ТАК - перестань быть злым"
источник
1

DOCx сжат, и это не текстовый формат. Так что вам нужен конвертер в первую очередь. После этого вы можете использовать findкоманду для преобразованных файлов.

Nils
источник
Или вы можете использовать инструмент поиска, который может читать внутри сжатых файлов. В вашем последнем предложении, я полагаю, вы имели в виду grep?
Жиль "ТАК - перестань быть злым"
@ Жиль - посмотрите на оригинальное название вопроса, прежде чем Майкл его отредактировал. Похоже, это был вопрос о DOS (и я отметил его не по теме).
Нильс