У меня есть два каталога: old/
и new/
. Некоторые из файлов в old/
являются дубликатами тех в new/
. Некоторые просто имеют одно и то же имя, а некоторые могут даже иметь идентичный контент, но разные имена. Меня не интересует путь подкаталога к файлам, поэтому при сопоставлении необходимо учитывать только неквалифицированное имя файла.
Я хочу удалить дубликаты файлов old/
, чтобы они содержали только файлы, не найденные в new/
. Для случаев, когда имена файлов совпадают, но не содержимое, или наоборот, я хочу, чтобы это было указано в некотором журнале.
Кто-нибудь сталкивался с подобной проблемой, или есть лучшее решение, чем взломать (Perl или подобный) скрипт с нуля? Время выполнения, в котором преобладает вызов md5sum
каждого файла, является приемлемым.
fdupes - находит дубликаты файлов в заданном наборе каталогов
-d для удаления
-Н за не спрашивай
источник