Удалить дубликаты mp3 с другим именем, размером и хешем

9

У меня огромная музыкальная библиотека (все в формате mp3), но у меня музыка почти такая же, но:

  1. Может быть, на одну или две секунды дольше
  2. Около 97% так же, как другая песня
  3. Или другой битрейт.

Есть ли способ найти эти дубликаты? Как уже упоминалось, они не имеют одинаковый размер, имя или SHA1-хэш.

Ханс Гроффен
источник

Ответы:

3

Есть открытая система акустической дактилоскопии под названием Echoprint , вы можете проверить, хочу ли я дедуплицировать большую коллекцию . Я не использовал его раньше (просто наткнулся на него), но звучит здорово, что я могу сделать это локально.

Адриан Фрювирт
источник
Независимо от этого, если ваши файлы правильно помечены (я не уверен, что под именем вы подразумеваете имена файлов и / или теги ID3), существуют также инструменты дедупликации, которые работают на основе тегов.
Адриан Фрювирт,
6

Используйте MusicBrainz's Picard . Он сканирует музыку, чтобы сгенерировать «отпечаток пальца», а затем сравнивает его с онлайн-базой данных, чтобы идентифицировать его (извлекая всю информацию, такую ​​как «Исполнитель», «Альбом» и т. Д.).

После идентификации песен он может организовать их в собственную структуру каталогов и имен, и вы можете использовать ее для поиска дубликатов.

Полностью совместим с Linux.

Патрик
источник
Это определенный путь, прекрасно работает.
SLM
Хорошо, я думаю, у меня есть проблема. Ни одна из моей музыки не является коммерческой. Большая часть из них загружена с Jamendo по лицензии CC. Он говорит, что не может найти никаких совпадений.
Ганс Гроффен
@ HansGroeffen тогда это будет проблемой. Вам разрешено публиковать отпечатки пальцев ранее неизвестной музыки, поэтому вы можете сделать это, но вам следует приложить усилия, чтобы подтвердить, что представление является точным. Поскольку вы не совпадали с именами, это может быть не очень хорошей идеей. Я не уверен, есть ли способ просто использовать это для его возможностей снятия отпечатков пальцев и сравнения.
Патрик
2
База данных MusicBrainz, которую использует Пикард, редактируется пользователем. Вы можете создавать новые записи для исполнителей, произведений (песен) и выпусков (альбомов / EP), а затем использовать Picard, чтобы пометить / переместить файлы. Это немного усилий, но это работает - и это полезно для других.
naught101
3

Я бы порекомендовал использовать beetsс его duplicatesплагином; beetsпохож на picardфункциональность (он может искать информацию ID3 из базы данных musicbrainz и организовывать ваши файлы на основе этой информации), но выходит за пределы возможностей picard с некоторыми из его плагинов.

Лично я использую их вместе - Picard для очистки ID3-тегов и свеклы для организации файлов и очистки дубликатов.

STW
источник