Как я могу найти дубликаты песен?

Ответы:

24

DupeGuru Music Edition - это то, что вы хотите. Установите тип сканирования «Аудио содержимое» в настройках. Пожалуйста, обратите внимание, что программа является справедливой, поэтому, пожалуйста, внесите свой вклад, если можете

альтернативный текст

Я предлагаю вам соединить это с MusicBrainz Picard, который может автоматически помечать ваши музыкальные файлы.

альтернативный текст

Ли Ло
источник
ИДЕАЛЬНЫЙ! Наконец ответ, который работал как шарм :). Плагин Banshee или что-то еще было бы лучше, но это прекрасно работает! Я на самом деле удалил около 8 ГБ дупс, ура!
Инго
2
Жаль, что dupeGuru может делать только 10 удалений одновременно, не вкладывая деньги.
Джон Маккин Пруитт
PPA мертв для последних выпусков Ubuntu. Я успешно установил .deb непосредственно с launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351 и затем запустил dupeguru_me.
rjh
В последней версии нет ограничений на удаление. Однако, похоже, что он не распознает музыку, он просто сравнивает имена файлов и информацию ID3. Если вы сначала используете такой инструмент, как Picard, чтобы пометить свою музыку, он должен хорошо поработать :)
rjh
10

Есть плагин, который был сделан некоторое время назад для этого. Я использовал это недавно, но это все еще оставляет желать лучшего. Для этого есть « PPA » - но пока нет встроенных пакетов, только ветка Bazaar. Инструкции по установке идут примерно так:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Если вы заинтересованы в использовании исходного кода Bazaar, сделайте следующее:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

После установки перезапустите Rhythmbox, и у вас должен появиться Duplicates Finder в списке плагинов.

список плагинов

После активации - доступны дополнительные параметры конфигурации.

окно конфигурации

После того, как плагин включен - и когда он находит дубликаты - он добавит дополнительную опцию в список вашей библиотеки:

список

Несколько настроек, которые я нахожу «странными» - я пробовал это в медиатеке с более чем 120 000 песен (более 1000 дубликатов) и библиотекой с около 1000 песен и, возможно, 30 дубликатов. По первому это заняло ОЧЕНЬ много времени и несколько раз сбивало Rhythmbox во время поиска. В конце концов я выбрал «Удалить из библиотеки» автоматически, чтобы избежать перестройки списка. На небольших библиотеках все работает отлично, хотя.

При обнаружении дубликата - если у вас выбраны параметры по умолчанию - версия песни с более низким качеством будет добавлена ​​в список. Поэтому можно безопасно выбрать все песни в списке «Дубликаты» и «Удалить» (либо удалить с диска, либо удалить из библиотеки).

Марко Чеппи
источник
Большое спасибо за этот совет! Однако, кажется, ничего не происходит, как только я активировал его. Я не могу найти новую вкладку или что-то еще, где будут указаны дубликаты.
Инго
Возможно, вам придется переместить порог до 0,5, чтобы помочь разобраться с дубликатами. Он будет отображаться как дополнительный элемент в списке вашей библиотеки. Я обновил ответ, чтобы показать это.
Марко Чеппи
Это тоже пробовал. Нет успеха
Инго
5

Вы можете использовать fdupes для этого:

$ fdupes -r ~/Music

который дает вам список всех дубликатов файлов.

Вы можете легко установить его с

sudo apt-get install fdupes
Johann
источник
4
Это сработало лучше, чем другие варианты. Тем не менее, он не очень подходит для аудио файлов. Программное обеспечение не сравнивает теги и т. Д., Что приводит к очень короткому списку файлов, в то время как на самом деле существует множество дубликатов, однако, возможно, они имеют не одинаковый размер файла (как они могут быть из разных источников).
Инго
3

Я столкнулся с подобной проблемой, когда у меня была куча дублированных файлов изображений. В моем случае я просто использовал md5sumфайлы и отсортировал результаты:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

Файлы с одинаковым содержимым генерируют одинаковый хэш, поэтому дубликаты могут быть легко найдены. Я вручную удалил дубликаты оттуда, хотя я мог бы расширить сценарий для удаления всего, кроме первого вхождения, но я всегда параноичен делать это в специальном сценарии.

Обратите внимание, что это работает только для дубликатов файлов с одинаковым содержимым.

Джон Боде
источник
Быстрее:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Роберт Вила
1

Попробуйте FSlint или dupe gredtter

Для установки типа FSlint в терминале (Ctrl-Alt-T)

sudo apt-get install fslint

надеюсь, что это полезно ..

FOSS DIVERSER
источник
-2

Я использовал FSlint, чтобы найти дубликаты файлов в целом. FSlint - это «утилита для поиска и очистки различных форм ворса в файловой системе».

Aputsiak
источник
Это странно. FSlint не находит ни одной из моих дублирующих песен!
Инго
FSlint с настройками по умолчанию может найти дубликаты файлов, измеренные по имени файла и размеру файла, но не дубликаты песен, если это разные записи с разным размером и именем файла.
Апуцяк
Различные записи (ремиксы?) Небезопасны для удаления. Они могут иметь собственную ценность.
Extender
Я также использовал fslint для аудио (с достаточным успехом) - хотя, учитывая некоторые альтернативы в этой теме, я, вероятно, попробую один из них в следующий раз.
Белаква