Какое программное обеспечение может найти близкие дубликаты из картинок стоимостью 2 ТБ?

12

Я собрал все свои фотографии на один жесткий диск. Я ищу программное обеспечение, которое работает на Mountain Lion, чтобы помочь в поиске похожих фотографий, чтобы я мог просматривать и удалять лишние файлы.

В моем хранилище картинок сейчас 2 ТБ, поэтому идеальным будет пакетное и / или эффективное программное обеспечение. Я точно знаю, что есть много дубликатов, и есть много программ, которые могут найти точные дубликаты.

Я ищу то, что найдет:

  1. картинки, которые идентичны, за исключением вращения
  2. изображения, которые идентичны, за исключением размера (то есть оригинал и миниатюра из iPhoto, или оригинал или уменьшенная версия для Интернета и т. д.)
  3. картинки, которые похожи

Я предполагаю, что № 1 возможен, но я не уверен насчет № 2 или № 3. Какое программное обеспечение может выполнить любую или все эти задачи?

Ти Джей Луома
источник
# 3, вероятно, не возможно, хотя 1 и 2 должны быть.
Linuxios
1
№ 3 это сложный вопрос. Я знаю это, потому что я работал в команде, которая отвечала за то, чтобы скрыть p0rn (и другие плохие вещи) от сайта социальной сети. Мы могли бы занести в черный список определенную фотографию, но затем кто-то мог бы изменить один пиксель и загрузить снова. Однако, думайте об этом как об обобщении достижений в программном обеспечении распознавания лиц.
Андрей Лазарь

Ответы:

6

Лучшее, что я смог найти и использовать - это Duplicate Annihilator, который работает с iPhoto и обновлен до 10.8. Вы можете скачать и выполнить пробежку и, надеюсь, избавиться и почистить ваши папки с первого раза. Для того, что вам нужно, вам может понадобиться несколько проходов, чтобы получить очевидные ошибки, а затем найти более трудные, чтобы получить их.

http://www.brattoo.com/propaganda/

Я не совсем уверен, что он найдет ваши № 2 и № 3 прямо за воротами, но поскольку фотографии помечены уникальными временными метками и другими метаданными, он должен найти их, даже если повернуть. Подобная часть немного сложнее, поскольку критериями для подобного может быть много вещей. Пройдите несколько раз, сначала проверив мое имя файла, затем, возможно, размеры, дату создания и т. Д.

КЛЮЧЕВАЯ ОСОБЕННОСТЬ

  • Обнаруживает дубликаты
  • Обнаруживает импортированные эскизы
  • Обнаруживает пропущенные изображения
  • Легко находите и уничтожайте дубликаты, созданные внутри iPhoto или во время импорта.
  • Сравните изображения, используя различные алгоритмы, чтобы обнаружить и понять различия.
  • Обнаружение дубликатов с использованием эффективных алгоритмов с использованием электронных контрольных сумм, таких как MD5.
  • Обнаружение дубликатов с помощью мета-данных конкретного файла, таких как имя файла, размеры, размер файла, дата создания Exif или дата создания.
  • Удалите дубликаты при обнаружении или пометьте их ключевым словом, чтобы их было легко найти с помощью таких функций iPhoto, как поиск или интеллектуальные папки. Используются только стандартные функции Apple и API. Никаких взломов и несанкционированных действий с системными файлами iPhoto. Бесплатные обновления! Доступно на английском, немецком, французском, итальянском и шведском языках.
donlaur
источник
Это хорошее предложение, однако мои фотографии не все в iPhoto, на самом деле большинство из них не в iPhoto.
TJ Luoma
Это может быть так, но вы не просили решение за пределами iPhoto. Организация их в iPhoto - лучшее решение, чем использование какого-либо конкретного программного обеспечения. Импорт их в одном месте сам по себе может удалить некоторые дубликаты во время импорта.
Donlaur
Я только что установил fdupes, используя инструкции здесь, macappstore.org/fdupes/#comment-83390, и эта командная строка в терминале идентифицирует точные дубликаты, то есть файлы, которые могут иметь другое имя, но быть абсолютно идентичными (проверка md5sum). Использовать команду hte просто, например: fdupes -r -A путь к каталогу на экране> ~ / Desktop / Duplicated-files-.txt "
Yves
1

Это не совсем то, что вы ищете, но это поможет вам легко найти эти дубликаты: http://macpaw.com/gemini

tdhulster
источник
Но разве это не работает только для файлов, которые идентичны на двоичном уровне?
Nohillside
Это может быть, но я не уверен ... Я только что нашел это, и это выглядит очень простым в использовании, но предложение "Донлаур", возможно, более точно для "TJ Luoma" его проблемы, чем мое решение.
tdhulster