Получить все расширения и их количество файлов в каталоге

14

Получить все расширения для каталога: легко. Получение количества файлов для определенного расширения: легко.

Но получение всех расширений файлов и их соответствующего количества файлов намекает на меня.

например.

+ dir
 + abc.txt
 + def.txt
 + abc.pdf
 * def.pov

должен вернуть что-то вроде:

.txt 2
.pdf 1
.pov 1

Цель этого упражнения - узнать, какое расширение файла популярно в определенном каталоге.

заранее спасибо

denormalizer
источник

Ответы:

47
/var/cache$ sudo find ./ -type f | grep -E ".*\.[a-zA-Z0-9]*$" | sed -e 's/.*\(\.[a-zA-Z0-9]*\)$/\1/' | sort | uniq -c | sort -n
      1 .6
      1 .cache
      1 .noconf
      1 .php
      1 .sl
      2 .bin
      2 .el
      2 .tdb
      4 .baseA
      4 .baseB
      4 .dat
      4 .DB
     27 .db
    221 .deb

Вот экспликация:

find ./ -type f

найти только файл, а не каталог

grep -E ".*\.[a-zA-Z0-9]*$"

файл фильтра с расширением

sed -e 's/.*\(\.[a-zA-Z0-9]*\)$/\1/'

удалить путь и имя файла, сохранить только расширение

sort | uniq -c | sort -n

сортировка, уникальность и сортировка

bindbn
источник
Вы можете сделать так, чтобы ваше регулярное выражение позволяло добавлять больше символов в расширение и исключать grepего, выполняя следующие действия:sed -ne '/\.[^./]*$/s/.*\(\.[^.]*\)$/\1/p'
Приостановлено до дальнейшего уведомления.
Деннис, заменив Grep и СЭД с SED возвращает следующее сообщение об ошибке: СЭД: -e выражение # 1, символ 30: неверная ссылка \ 1 на `РИТ Команда S'в
denormalizer
2

Поскольку вы используете Linux (gnu grep), сейчас -Pсамое время использовать Perl RE (PCRE) и -oопцию grep . Принимая ответ @ bindbn как отличного кандидата:

find . -type f | grep -Po '\.([\w\d])*$' | sort | uniq -c | sort -n
Джим
источник