Какие дубликаты файлов и папок существуют для Windows? [закрыто]

57

Мне нужно бесплатное приложение для поиска и удаления дубликатов файлов, с возможностью найти дубликаты файлов / папок по имени и / или по размеру и удалить один из дубликатов.

Andrija
источник
Это можно сделать с помощью сценария оболочки BASH: superuser.com/questions/386199/…
Андерсон Грин,

Ответы:

9

Некоторое время назад был доступен Duplicate File Finder, но теперь он доступен только на вторичных сайтах, например, в справочнике Softpedia .

Сайт Wareseeker показывает правильную ссылку, http://dff.nazrashid.com/которой больше нет. Я был бы осторожен при получении исполняемых файлов с таких сайтов, хотя.

Он может выполнять поиск дубликатов в нескольких деревьях каталогов на основе,

  • содержание (я думаю, что это соответствует MD5)
  • размер
  • имя
  • имя и размер
  • содержание и название

И это позволяет вам фильтровать ваш поиск по минимальному и максимальному размеру файлов (ускоряет работу, когда вы знаете границы).

Очень вдумчивый кусок программного обеспечения. Не знаю, есть ли что-то настолько быстрое и бесплатное в наши дни.


Комментарии относятся к аналогичному инструменту Sourceforge под названием Doubles

Nik
источник
2
На самом деле это доступно на SourceForge здесь: doubles.sourceforge.net
BinaryMisfit
3
Могу ли я предложить удалить ссылку Wareseaker. Я думаю, что мы должны быть осторожны при обращении к сайтам Warez в целом.
BinaryMisfit
Я согласен с вами Diago. Я попытался найти инструмент DupeFinder и не смог его найти. doublesИнструмент похож , но это не то же самое.
Ник
1
Для чего он стоит, я нашел веб-сайт (по крайней мере, домашнюю страницу) в Wayback Machine: wayback.archive.org/web/20070115135708/http://dff.nazrashid.com с другой ссылкой для скачивания: wayback.archive.org /web/20061207062803/http://dff.nazrashid.com/...
seanf
25

Я пробовал буквально десятки дубликатов поиска файлов (у меня все еще есть установочные файлы / ZIP-файлы, около 20 из которых сидят без дела). Некоторое время я использовал CloneMaster 2.19, потому что он был лучшим из тех, что я мог найти, хотя даже это не было идеальным (я хотел тот, который мог бы также определять дубликаты MP3 по аудиоконтенту, игнорируя теги). У всех них были проблемы, которые меня расстроили настолько, что я решил написать свою собственную и выложил список функций, которые мне требуются от DFF.

И тогда я нашел AllDup . Это первый и единственный, который фактически заставил меня отказаться от проекта (технически мой не полностью заброшен, над ним просто больше не работают, так как мне больше не нужно его писать, потому что AllDup делает все, что я от него хочу). В любом случае, AllDup ищет дубликаты файлов, но в отличие от других, он использует множество приемов и приемов, которые я собирался использовать в своем собственном DFF. Таким образом, он очень быстрый: он может, например, сканировать> 250 000 форматов от 1B-5GB за ~ 30 минут (я делал это в своей системе несколько раз).

Еще одна замечательная (и по некоторым причинам редкая) особенность AllDup заключается в том, что, как я уже упоминал, он может сканировать дубликаты MP3 по их фактически аудиоданным, игнорируя теги, поэтому два MP3, которые имеют одинаковые, но разные теги (очень часто встречаются при загрузке), будут быть обнаружены как дубликаты. (Он может даже обнаружить, когда я скопировал две одинаковые песни с двух разных компакт-дисков - конечно, с разными тегами.) Конечно, он может обнаружить дубликаты на основе других факторов, помимо байтового содержимого, таких как имена файлов, даты и т. Д.

Другие замечательные возможности AllDup включают возможность фильтрации (включения или исключения) на основе имени файла и / или имени папки и / или размера файла. Экран результатов также очень универсален с опциями выбора файлов на основе даты, пути, имени, этого, этого, другого ... У него также есть разнообразие в том, что делать с обнаруженными дубликатами

Майкл Туммерер также очень восприимчив. Я несколько раз сообщал ему об ошибках и предлагал ему новые функции, на которые он очень быстро обратился (до такой степени, что он сказал мне загрузить и опробовать бета-версию с обновлениями в следующих электронных письмах того же дня).

Ох, и это бесплатно.

НТН

оборота Синетек
источник
Ссылка не работает.
Иосиф
Спасибо за уведомление. Я предполагаю, что я, должно быть, набрал URL-адрес вручную и сохранил GTLD.
Synetech
Нет, в результате автокоррекции Chrome были изменены значения «e» и «d» (как это происходит, когда я пытаюсь набрать dr. ) Grrr. (Это исправлено, для протокола.)
Synetech
Я также использовал много, и на этом я остановился. Интерфейс немного неуклюжий, но в нем много полезных опций.
эндолит
Вы пробовали версию 3? Это довольно продано.
Synetech
14

Duplicate Cleaner очень быстр и имеет широкие возможности фильтрации результатов.

Димитрий С.
источник
Это выглядит мило. Это бесплатное программное обеспечение, работает в Windows 7, имеет множество методов фильтрации и поддерживает создание жестких ссылок NTFS вместо удаления.
эндолит
1
Не можете обработать имена файлов Unicode, хотя?
эндолит
1
Он обрабатывает дубликаты папок?
Андерсон Грин
1
На самом деле, он обрабатывает дубликаты папок. Это первая (пока) программа, которая может идентифицировать дубликаты папок, а также дубликаты файлов.
Андерсон Грин
Pro версия обрабатывает файлы повернутых изображений. Большой! Наконец-то я могу отсортировать фотографию с iOS из своих резервных копий Dropbox.
JcMaco
8

Clonespy http://www.clonespy.com

Я считаю это очень полезным и более полезным, чем doublekiller. Особенно приятной функцией является функция «Пулы», где вы можете сравнить одну группу каталогов с другой группой каталогов, игнорируя при этом дубликаты внутри групп.

Например, мой партнер любит хранить дубликаты файлов изображений при работе с изображениями. Я хочу посмотреть, есть ли у меня какие-либо копии этих файлов в моих каталогах.

Пул 1 - Домашний каталог партнера. Пул 2 - Мой домашний каталог.

Единственные найденные дубликаты - это если файл присутствует как в моих каталогах, так и в каталогах моего партнера. Файлы, только дублированные в каталогах моего партнера, игнорируются.

pcapademic
источник
Можете ли вы использовать CloneSpy, чтобы найти все дубликаты файлов (или дубликаты папок) в определенном каталоге?
Андерсон Грин
@AndersonGreen Да для дубликатов файлов
FelipeAls
Это единственный инструмент поиска дубликатов, с которым я столкнулся, который позволяет вам выполнять перекрестное сравнение одного файла (при условии, что вы поместили его в подходящее место для папки) или структуры дерева папок с другой структурой дерева папок (или набором папок). или древовидные структуры). Все остальные инструменты, которые я пробовал на протяжении многих лет, провалились именно в этот момент! Это единственный, кто делает это правильно.
Самир
Я часто оказывался в ситуации, когда я знал, что смотрю на файл с дубликатом где-то еще, но не могу вспомнить, где хранится эта другая копия. Звучит знакомо? Или я знаю, что файл является копией другого файла, и я даже знаю местоположение этой другой копии, но я должен сравнить ее с ней, чтобы увидеть, какую именно я хочу сохранить. Я мог бы даже иметь две или три другие копии или версии этого во втором месте. Это переломный момент, когда различие между инструментом diff и инструментом dupe становится туманным.
Самир
Сравнение пул с пулом просто убийца! Это главное преимущество перед другими инструментами. Что касается инструментов diff и dupe, мне еще предстоит найти инструмент, который подделывает их в одно программное обеспечение. Я думаю, что Beyond Compare близко к этому, но это все еще в миле. У него определенно есть потенциал, и это лучшие инструменты сравнения, которые я использовал.
Самир
7

У меня есть следующий пакетный файл в течение некоторого времени:

@ECHO OFF
REM TODO: Help when run with /? and switch for recursion
REM Furthermore check whether we might have enough files to hit the envvar length limit
REM and switch strategies accordingly (slower but finds all dupes then)
SETLOCAL ENABLEEXTENSIONS ENABLEDELAYEDEXPANSION
REM This method speeds up comparison but suffers from long file lists
REM as environment variables have a length limit
SET FILELIST=
FOR %1 %%i IN (*) DO (
    FOR %%j IN (!FILELIST!) DO (
        IF %%~zi EQU %%~zj (
            fc /b "%%~i" "%%~j">NUL && echo "%%~i" = "%%~j"
        )
    )
    SET FILELIST=!FILELIST! "%%~i"
)
ENDLOCAL
GOTO :EOF

Вы можете запустить его в /rкачестве аргумента для рекурсивного запуска по дереву каталогов.

детеныш
источник
1
Отличное решение для гиков!
JBRWilkinson
Downvoter: Было бы полезно, если бы вы сказали, почему, по вашему мнению, это не помогло.
Джои
Небольшое предупреждение: в Windows вложенные циклы иногда приводят к преждевременному завершению внешнего цикла в больших структурах каталогов. Мне повезло с наличием внешнего цикла в callвиде отдельного командного файла, содержащего внутренний цикл.
mikewse
4

У Total Commander есть замечательная утилита поиска дубликатов файлов. К сожалению, это не бесплатно.

Как упоминал Ник, есть Duplicate File Finder с открытым исходным кодом и кросс-платформенный. Это доступно на SourceForge здесь

BinaryMisfit
источник
3

DoubleKiller - отличный бесплатный (у них также есть профессиональная версия) поиск и удаление дубликатов файлов. Я использую это в течение многих лет и полностью рекомендовал бы это.

http://www.bigbangenterprises.de/en/doublekiller

Крис Драйвер
источник
3

Winmerge http://winmerge.org/

Сравните очень похожие каталоги, возможно, между вашей папкой «Documents» и вашей импровизированной «резервной копией», папкой «Copy of Documents», которую вы создали несколько недель назад «на всякий случай».

Вы можете выяснить, какие файлы все еще идентичны, какие файлы являются самыми новыми (или самыми старыми, если вы столкнулись с проблемой), и какие файлы существуют только в одном месте. Затем вы можете «объединить» каталоги и удалить дубликаты.

pcapademic
источник
Можете ли вы использовать WinMerge для получения списка дубликатов файлов и папок в одном конкретном каталоге?
Андерсон Грин
2

Duplocator . Кросс-платформенный скрипт Python для поиска дубликатов.

mutewinter
источник
1
Ссылка не работает.
Nifle
1

Я всегда использовал старую программу Find Duplicates , но теперь, когда Geocities уничтожен, я думаю, что она больше не существует, так что вот копия файла .

Он отображает файлы в удобных для просмотра группах, выделенных цветом. Он предупреждает вас, если вы отметили все копии файла для удаления, можете пометить их автоматически, можете выборочно пометить все файлы в каталоге (я часто это использовал), можете удалить каталоги, которые становятся пустыми после удаления, и т. Д. осторожны со ссылками, если вы используете его в Wine. Он удалит все копии файла, не зная, что они являются ссылками.

эндолита
источник
Я перешел на AllDup.
эндолит
1

Я нашел еще один Duplicate File Remover, чтобы быть удивительным. Это довольно новый и очень простой в использовании. Я использовал его для сравнения более 50 000 файлов из проекта восстановления жесткого диска, поэтому он может обрабатывать большое количество файлов.

Джозеф
источник
1

Лучшим решением, которое я тестировал на Windows, был уже упомянутый Alldup . Реквизит для Synetech Inc. для того, чтобы поделиться этим. Блестящий и очень профессиональный бесплатный инструмент.

В этом посте я приведу протестированные решения bash, которые будут работать в Cygwin, Linux и OS X (или в любом другом, использующем bash-like оболочку).

Поиск дубликатов файлов с использованием бесплатных и открытых инструментов

Кайл
источник
2
Может ли AllDup генерировать список дубликатов папок вместо дубликатов файлов?
Андерсон Грин
не то, чтобы я знал
Кайл
1

Еще одна утилита:

http://yurichev.com/ddff.html

* Comparison to other duplicate finding utilities:

+ Very fast
+ Comparing directories too.
+ Often, two directories contain, let's say, 4 equal files and 5th file is different.
  We handle it too and output these as "common files in directories"
+ Absence of unnecessary switches.

- Win32 only
- Command-line only
оборота Денис Юричев
источник
1

Быстрый поиск дубликатов файлов:

  • Совершенно бесплатно
  • Можно определить дубликаты независимо от того, где они находятся в каталоге / папки структуры
  • Простой в использовании интерфейс Windows
  • Может создавать отчеты в форме XML
  • Может Переместить дубликаты в корзину или другую корневую папку, сохраняя исходную структуру папок, например, если дубликат файла находился в папке внутри другой папки, этот путь был бы сохранен: файл все еще будет существовать в папке внутри папки, и эта структура будет перемещена в папку, выбранную пользователем - будь то корзина для утилизации или папка, указанная пользователем
  • Быстрый алгоритм двоичного сравнения, а также проверка имени файла и размера.

http://www.mindgems.com/products/Fast-Duplicate-File-Finder/Fast-Duplicate-File-Finder-About.htm

оборота therobyouknow
источник
не могли бы вы объяснить пункты 2 и 5?
Milind R
обновленный @MilindR, пожалуйста, дайте мне знать, если это поможет
therobyouknow
Спасибо .. Я все еще не понимаю пункт 2, хотя .. Дубликаты файлов должны быть найдены где угодно, верно?
Milind R
Да исправить. Например: рассмотрим 2 файла с одинаковым содержанием. Файл 1 находится в пути / folder1 / folder2 / file1, а файл 2 находится в пути / folder3 / folder4 / folder5 / file2 - Быстрый поиск дубликатов файлов найдет оба из них и сообщит о них как об одном и том же, и пользователь может выбрать, какой из них они хочу удалить.
therobyouknow
Ах, это, да, это проясняет это. Хотя я думаю, что это обычно считается само собой разумеющимся при рассмотрении программы, которая ищет дубликаты файлов.
Milind R