Я работаю над кластером, которым поделились другие коллеги. Жесткий диск ограничен (и в некоторых случаях он был переполнен), поэтому я иногда очищаю свою часть. Я хочу сделать это быстро, поэтому до сих пор я делаю это, создавая список файлов размером более 100 МБ старше 3 месяцев, и я вижу, нужны ли они мне по-прежнему.
Но теперь я думаю, что может быть папка с> 1000 файлами меньшего размера, которые мне не хватает, поэтому я хочу получить простой способ выяснить, так ли это. По тому, как я генерирую данные, это поможет получить список общего размера для каждого расширения. В контексте этого вопроса «расширение» - все, что находится за последней точкой в имени файла.
Предположим, у меня есть несколько папок с несколькими файлами:
folder1/file1.bmp 40 kiB
folder1/file2.jpg 20 kiB
folder2/file3.bmp 30 kiB
folder2/file4.jpg 8 kiB
Можно ли составить список общего размера файлов для каждого расширения файла, так вот так:
bmp 70 kiB
jpg 28 kiB
Мне безразличны файлы без расширения, поэтому их можно игнорировать или поместить в одну категорию.
Я уже пролистал справочные страницы ls
, du
и find
, но я не знаю, какой инструмент подходит для этой работы ...
источник
Ответы:
В системе GNU:
Или то же самое
perl
, избегая-printf
расширения GNUfind
(все еще использующего расширение GNU-print0
, но это более широко поддерживается в настоящее время):Это дает вывод как:
Если хотите
KiB
,MiB
... суффиксы, отправьтеnumfmt --to=iec-i --suffix=B
.%b*512
дает использование диска, но обратите внимание, что если файлы жестко связаны несколько раз, они будут подсчитаны несколько раз, поэтому вы можете увидеть расхождение с тем, какиеdu
отчеты.источник
-printf
относится к GNUfind
, поэтому я и сказал о системе GNU .perl
альтернативой, которая должна работать даже на macOS.Вот еще одно решение:
Часть, которая получает расширения:
Затем найдите файлы с расширением и распечатайте их на экране:
Далее мы хотим сохранить расширение и итог:
и держите его в одной строке:
источник
Не так хорошо, как решение Стефана, но вы можете попробовать
где вы должны запустить это для каждого типа файлов.
источник
du
выполняется только один вызов. В GNUxargs
вы бы хотели добавить-r
флаг, чтобы du не запускался, когда файла нет (в противном случае вы бы в конечном итоге использовали диск текущего каталога). Вы можете добавить-type f
или,! type d
чтобы избежать подсчета файлов, которые находятся в каталогах, имя которых заканчивается на.png
.