Существует ли инструмент командной строки для текстового поиска файла docx? Я пытался grep
, но он не работает с DOCX, хотя он прекрасно работает с файлами TXT и XML. Я мог бы сначала конвертировать docx в txt, но я бы предпочел инструмент, который работает непосредственно с файлами docx. Мне нужен инструмент для работы под Cygwin.
OP edit: Позже я узнал, что самый простой способ получить grep - это на самом деле преобразовать эти docx в txt, а затем grep поверх них.
grep
search
cygwin
microsoft-word
Gob00st
источник
источник
Ответы:
Я знаю несколько инструментов индексирования, которые поддерживают документы Word. Такие инструменты позволяют индексировать документы, а затем эффективно искать слова в индексе. Они не разрешают полнотекстовый поиск.
источник
DOCx сжат, и это не текстовый формат. Так что вам нужен конвертер в первую очередь. После этого вы можете использовать
find
команду для преобразованных файлов.источник
grep
?Вы смотрели на openoffice ниндзя ?
(не знаю о поддержке Cygwin)
источник