Сходство и / или различие двух документов ODT (Linux)

14

У меня есть два документа ODT, они имеют очень близкое содержание, я хочу сравнить их, чтобы увидеть, насколько они похожи.

Лучше всего было бы иметь процент сходства , если не возможно, альтернативой было бы, по крайней мере, иметь какой-то тип diff .

Я использую Ubuntu Lucid .


Решение:

Я использовал odt2txtдля преобразования файлов в текст, а затем wdiff -i --statistics one.txt two.txtимел статистику, которая давала мне процент общих слов (сходство).

Weboide
источник

Ответы:

8

Я не пробовал их сам, но эта пара инструментов - odt2txt и oodiff - выглядит многообещающе.

JRobert
источник
1
Я использовал odt2txt, чтобы преобразовать их в текст, а затем использовал wdiff, который выдает diff по слову.
Weboide
Благодарю. Это отлично подходит для использования в системах контроля версий, таких как git или mercurial. См. Методы интеграции / автоматизации в OpenDocument, diff и контроль
версий
20

Вы пробовали встроенную функцию сравнения? Редактировать / Сравнить документ ...

Если вы просто хотите использовать текстовые различия, лучше всего конвертировать оба документа в обычный текст, а затем выполнять регулярные сравнения с ними. Вы должны будете выяснить, как нормализовать переносы строк, иначе разница будет не очень полезна.

sleske
источник
1
Отличная функция в LibreOffice, я никогда не слышал об этом! Очень полезно, но статистика не приводится.
Страгу
Отлично! Я никогда бы не подумал заглянуть в меню « Правка», чтобы сравнить документы. Я посмотрел в меню « Файл» , « Инструменты» и « Окно» , последнее из которых - расположение Word от uSoft.
Wallyk
4
В последней версии это, кажется, Правка -> Отслеживать изменения -> Сравнить документ ...
FableBlaze
1

Если вас не волнует форматирование текста, вы также можете скопировать содержимое в текстовые файлы и использовать старый добрый diff.

ps: вы учитель ищите возможных читеров? :п

tamtakos
источник
LOL Нет, я не учитель, но да, это был бы хороший способ искать мошенников :)
Weboide
1

Я делаю это для того, чтобы создать файлы .pdf с помощью libreoffice, а затем использовать diffpdf для сравнения двух файлов pdf. Это показывает различия, выделенные в параллельных окнах

Питер Аллотт
источник