В каком формате вы хотите, чтобы текстовые файлы были? Лишенный всякого форматирования или более богатый, например Markdown, который поддерживает этот сайт?
Даниэль Бек
Ответы:
4
Вы не упомянули, какой вкус у UNIX, но я думаю, что есть текст на многих.
-convert fmt Convert the specified files to the indicated format and
write each one back to the file system.
fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml,
odt, or webarchive
Насколько я могу судить, antiword не работает с документами RTF.
Дино
@dino: Ты прав, моя ошибка.
Тор
3
Существует "unrtf", но хотя данные пакета Ubuntu утверждают, что он может создавать текстовый вывод, домашняя страница GNU unrtf не упоминает этот формат. Но, возможно, вы можете попробовать это.
Убунту прав. Страница man говорит: --text выбирает вывод простого текста ASCII.
Themroc
2
Беглый взгляд на файл RTF показывает, что разметка RTF - это что-то {braces}среднее между обратной косой чертой и пробелом \markup. Так что, возможно, stringsкороткий сценарий sed / awk / perl для удаления разметки приблизит вас к простому тексту.
Ответы:
Вы не упомянули, какой вкус у UNIX, но я думаю, что есть текст на многих.
http://www.unix.com/man-page/All/1/TEXTUTIL/
источник
Есть много разных, вот те, которые я успешно протестировал (все с открытым исходным кодом и бесплатно):
источник
Существует "unrtf", но хотя данные пакета Ubuntu утверждают, что он может создавать текстовый вывод, домашняя страница GNU unrtf не упоминает этот формат. Но, возможно, вы можете попробовать это.
источник
Беглый взгляд на файл RTF показывает, что разметка RTF - это что-то
{braces}
среднее между обратной косой чертой и пробелом\markup
. Так что, возможно,strings
короткий сценарий sed / awk / perl для удаления разметки приблизит вас к простому тексту.источник