diff -r только для определенных типов файлов

12

Есть ли способ, которым я могу выполнить рекурсивный анализ двух каталогов, но сравнивать только (в соответствующих местах) файлы, которые соответствуют определенному имени файла или предикату типа файла?

Например, я хотел бы сделать что-то вроде

diff -r dir-a dir-b -filenames *.java, ivy.xml, build.xml

... или даже лучше:

diff -r dir-a dir-b -filetype text

Ясно, что это не обязательно использовать, так diffкак я предполагаю, что заклинание с findи -exec diffможет также сделать свое дело (я просто не знаю, как генерировать дополнительные пути к файлам в последнем случае).

Маркус Юний Брут
источник
3
Есть возможность исключить файлы, которые соответствуют шаблону, я не вижу опции, чтобы включать только файлы, которые соответствуют шаблону.
Бармар
1
Все опции специфичны для сравнения каталогов можно найти на gnu.org/software/diffutils/manual/html_node/...
Barmar
1
посмотрите эту ссылку и посмотрите ответ Сержиу.
Иегуда
1
stackoverflow.com/q/10131908/2707864
sancho.s ReinstateMonicaCellio

Ответы:

1

Shellscript differ-r

Этот шеллскрипт может выполнять рекурсивный анализ двух каталогов, но сравнивать только (в соответствующих местах) файлы, которые соответствуют определенному имени файла или шаблону типа файла.

#!/bin/bash

greenvid="\0033[32m"
resetvid="\0033[0m"

if [ $# -ne 3 ]
then
 echo "Usage: compare files in two directories including subdirectories"
 echo "         $0 <source-dir> <target-dir> <pattern>"
 echo "Example: $0  subdir-1     subdir-2     \"*.txt\""
 exit
fi

cmd='for pathname do
        greenvid="\0033[32m"
        resetvid="\0033[0m"
        echo -e "${greenvid}diff \"$pathname\" \"${pathname/'\"$1\"'/'\"$2\"'}\"${resetvid}"
        diff "$pathname" "${pathname/'\"$1\"'/'\"$2\"'}"
    done'
#echo "$cmd"

find "$1" -type f -name "$3" -exec bash -c "$cmd" bash {} +

демонстрация

файлы:

$ find -type f
./1/ett.txt
./1/two.doc
./1/t r e.txt
./1/sub/only-one.doc
./1/sub/hello.doc
./1/sub/hejsan.doc
./differ-r2
./differ-r1
./differ-r
./2/ett.txt
./2/two.doc
./2/t r e.txt
./2/sub/hello.doc
./2/sub/hejsan.doc

Применение:

$ ./differ-r
Usage: compare files in two directories including subdirectories
         ./differ-r <source-dir> <target-dir> <pattern>
Example: ./differ-r  subdir-1     subdir-2     "*.txt"

Бег differ-r:

Выполненные diffкомандные строки печатаются зеленым текстом, а выходные данные, если нет совпадений, печатаются с текстом по умолчанию (белым на черном на следующем снимке экрана).

введите описание изображения здесь

$ ./differ-r 1 2 "*.doc"
diff "1/two.doc" "2/two.doc"
diff "1/sub/only-one.doc" "2/sub/only-one.doc"
diff: 2/sub/only-one.doc: No such file or directory
diff "1/sub/hello.doc" "2/sub/hello.doc"
2d1
< world
diff "1/sub/hejsan.doc" "2/sub/hejsan.doc"

$ ./differ-r 1 2 "*.txt"
diff "1/ett.txt" "2/ett.txt"
2c2
< stabben
---
> farsan
diff "1/t r e.txt" "2/t r e.txt"
1c1
< t r e
---
> 3
$ 

$ ./differ-r 1 2 "*"
diff "1/ett.txt" "2/ett.txt"
2c2
< stabben
---
> farsan
diff "1/two.doc" "2/two.doc"
diff "1/t r e.txt" "2/t r e.txt"
1c1
< t r e
---
> 3
diff "1/sub/only-one.doc" "2/sub/only-one.doc"
diff: 2/sub/only-one.doc: No such file or directory
diff "1/sub/hello.doc" "2/sub/hello.doc"
2d1
< world
diff "1/sub/hejsan.doc" "2/sub/hejsan.doc"

$ ./differ-r 2 1 "*"
diff "2/ett.txt" "1/ett.txt"
2c2
< farsan
---
> stabben
diff "2/two.doc" "1/two.doc"
diff "2/t r e.txt" "1/t r e.txt"
1c1
< 3
---
> t r e
diff "2/sub/hello.doc" "1/sub/hello.doc"
1a2
> world
diff "2/sub/hejsan.doc" "1/sub/hejsan.doc"

rsync с фильтром

Если вам не нужно получать какие-либо выходные данные, описывающие разницу, знать только, какие файлы отличаются или отсутствуют (чтобы их rsyncможно было скопировать), вы можете использовать следующую командную строку.

rsync --filter="+ <pattern>" --filter="+ */" --filter="- *"--filter="- */"  -avcn <source directory>/ <target directory>

демонстрация

$ rsync --filter="+ *.doc" --filter="+ */" --filter="- *"  -avcn 1/ 2
sending incremental file list
./
sub/
sub/hello.doc
sub/only-one.doc

sent 276 bytes  received 35 bytes  622.00 bytes/sec
total size is 40  speedup is 0.13 (DRY RUN)

sent 360 bytes  received 41 bytes  802.00 bytes/sec
total size is 61  speedup is 0.15 (DRY RUN)
olle@bionic64 /media/multimed-2/test/test0/temp $ rsync --filter="+ *.txt" --filter="+ */" --filter="- *" -avcn 1/ 2
sending incremental file list
./
ett.txt
t r e.txt
sub/

sent 184 bytes  received 29 bytes  426.00 bytes/sec
total size is 21  speedup is 0.10 (DRY RUN)

Если вы хотите чистый вывод без комментирования строк и без каталогов, вы можете сделать grepвывод следующим образом:

$ pattern="*.doc"; rsync --filter="+ $pattern" --filter="+ */" --filter="- *"  -avcn 1/ 2 | grep "${pattern/\*/.\*}"
sub/hello.doc
sub/only-one.doc

Shellscript rsync-diff

Этот однострочник может быть превращен в основную команду шеллскрипта rsync-diff.

#!/bin/bash

LANG=C

if [ $# -ne 3 ]
then
 echo "Usage: compare files in two directories including subdirectories"
 echo "         $0 <source-dir> <target-dir> <pattern>"
 echo "Example: $0  subdir-1     subdir-2     \"*.txt\""
 exit
fi

pattern="$3"; rsync --filter="+ $pattern" --filter="+ */" --filter="- *" \
 -avcn "$1"/ "$2" | grep "${pattern//\*/.\*}" | grep -v \
  -e '/$' \
  -e '^sending incremental file list$' \
  -e '^sent.*received.*sec$' \
  -e '^total size is.*speedup.*(DRY RUN)$'
sudodus
источник
0

Поскольку вы упомянули «Понятно, что не обязательно использовать diff»,

Это должно сделать работу для вас сливаться легко настраиваются для каких типов файлов игнорировать:

введите описание изображения здесь

более того, другой альтернативой было бы написать простой скрипт, который перенесет из белого списка в черный список, а затем черный список будет передан в diff с --excludeопцией.

JammingThebBits
источник
обновлены теги для добавления «командной строки»
Маркус Юниус Брутус
0

С поддержкой команд подстановки оболочки вы можете использовать следующую однострочную строку (как уже отмечалось @JammingThebBits):

diff -r dir-a dir-b --exclude-from=<( \
find dir-a dir-b -type f -not \( -name '*.xml'  -or -name '*.java' \) \
| sed 's:^.*/\([^/]*\)$:\1:' \
)

Это работает так: findищите файлы, которые вас не интересуют, sedизвлекают базовое имя (работает basenameочень медленно, если у вас много файлов) и помещают их во временный файл; такой файл затем передается на diffуказание исключить их из сравнения (двойное исключение = включение).

Если у вас нет подстановки команд, поместите sedвывод в файл и явно передайте его diff.

В примере, который я искал только для файлов XML и JAVA, измените их при необходимости, разделив их OR.

Corrado
источник