Как посчитать количество файлов в каталоге с помощью Python

224

Мне нужно посчитать количество файлов в каталоге, используя Python.

Я думаю, что самый простой способ len(glob.glob('*')), но он также считает сам каталог как файл.

Есть ли способ считать только файлы в каталоге?

prosseek
источник
Чтобы пропустить каталоги, вы можете сделать '* .fileextension' для любого расширения файла, которое вы ищете.

Ответы:

275

os.listdir()будет немного более эффективным, чем использование glob.glob. Чтобы проверить, является ли имя файла обычным файлом (а не каталогом или другим объектом), используйте os.path.isfile():

import os, os.path

# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])

# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
Даниэль Штутцбах
источник
14
Не забудьте добавить folder_pathвнутри, os.path.filename(name)если вы не на CWD. stackoverflow.com/questions/17893542/…
Рафаэль Оливейра
1
Это не учитывает файл во вложенных папках.
codersofthedark
5
Для рекурсивного подсчета файлов, вложенных в каталоги, вам лучше использовать решение os.walk ().
Джоэл Б,
В чем выгода использования os.path.join(DIR, name)более DIR + '/' + name? Последний короче и, ИМО, более понятен, чем первый. Возможно, есть какие-нибудь ОС, на которых последняя не сможет работать?
Привет, до свидания,
@HelloGoodbye Именно в этом причина.
ellockie
102
import os

path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
Люк
источник
2
Это не рекурсивно
Кайл Бриденстайн
48

Для всех видов файлов, подкаталоги включены:

import os

list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files

Только файлы (без подкаталогов):

import os

onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
Гильермо Перейра
источник
Это не рекурсивно
Кайл Бриденстайн
32

Вот где очень удобно использовать fnmatch:

import fnmatch

print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))

Более подробная информация: http://docs.python.org/2/library/fnmatch.html

ngeek
источник
3
Это намного быстрее (примерно вдвое меньше времени, когда я тестировал каталог с 10 000 файлов), если вы знаете шаблон, который вы ищете, вместо того, чтобы тестировать каждый файл с os.path.isfile()помощью принятого ответа. Также значительно быстрее, чем glob.glob().
CivFan
14

Если вы хотите сосчитать все файлы в каталоге, включая файлы в подкаталогах, самый питонический способ:

import os

file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)

Мы используем сумму, которая быстрее, чем явное добавление количества файлов (время ожидания)

Mr_and_Mrs_D
источник
1
Привет, я пытался понять этот код (код работает отлично), я знаю, что мы можем использовать _в forцикле. os.walkтакже я знаю. Но не уверен, что происходит с подчеркиванием внутри sumфункции, не могли бы вы уточнить. Спасибо!
Ejaz
1
Unsderscore - это просто имя переменной @Ejaz, по соглашению используемое, когда мы игнорируем переменную - это то, что мы делаем здесь - мы называем walk и подсчитываем только количество файлов в каждом каталоге, игнорируя возвращаемые значения root и dirs walk
Mr_and_Mrs_D
12
import os
print len(os.listdir(os.getcwd()))
сыпь
источник
2
Это может быть полезно иногда, но оно также включает в себя подкаталоги
Брайан Бернс
10
def directory(path,extension):
  list_dir = []
  list_dir = os.listdir(path)
  count = 0
  for file in list_dir:
    if file.endswith(extension): # eg: '.txt'
      count += 1
  return count
ninjrok
источник
10

Я удивлен, что никто не упомянул os.scandir:

def count_files(dir):
    return len([1 for x in list(os.scandir(dir)) if x.is_file()])
QED
источник
Прекрасно работает с Python 3.6!
Аоки Ахишатсу
7

Это использует os.listdirи работает для любого каталога:

import os
directory = 'mydirpath'

number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])

это можно упростить с помощью генератора и сделать немного быстрее с помощью:

import os
isfile = os.path.isfile
join = os.path.join

directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
Хоакин
источник
5
def count_em(valid_path):
   x = 0
   for root, dirs, files in os.walk(valid_path):
       for f in files:
            x = x+1
print "There are", x, "files in this directory."
return x

Взято из этого поста

Кристиан Дамиан
источник
2
1. filesэто список. 2. ОП не ищет рекурсивный счет
SilentGhost
4
import os

def count_files(in_directory):
    joiner= (in_directory + os.path.sep).__add__
    return sum(
        os.path.isfile(filename)
        for filename
        in map(joiner, os.listdir(in_directory))
    )

>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049
tzot
источник
4

Код Люка переформатировать.

import os

print len(os.walk('/usr/lib').next()[2])
okobaka
источник
4

Вот простая однострочная команда, которая мне показалась полезной:

print int(os.popen("ls | wc -l").read())
Боян Тунгуз
источник
Синтаксический анализ выходных данных lsобычно не одобряется (это может часто вызывать проблемы), хотя это не плохой «быстрый и грязный» метод в оболочке. Вы должны использовать ls -1, однако, так что это гарантирует одну строку на файл.
Bloodgain
3

Хотя я согласен с ответом, предоставленным @DanielStutzbach: os.listdir()будет несколько более эффективным, чем использование glob.glob.

Тем не менее, дополнительную точность, если вы хотите посчитать количество определенных файлов в папке, вы хотите использовать len(glob.glob()). Например, если вам нужно сосчитать все PDF-файлы в папке, которую вы хотите использовать:

pdfCounter = len(glob.glob1(myPath,"*.pdf"))
LBes
источник
2

Это просто:

print(len([iq for iq in os.scandir('PATH')]))

он просто считает количество файлов в каталоге, я использовал технику осмысления списка, чтобы перебрать определенный каталог, возвращая все файлы взамен. «len (возвращенный список)» возвращает количество файлов.

Ага Саад
источник
1
Добро пожаловать в переполнение стека. Качество этого ответа можно улучшить, добавив объяснение: Как ответить
Эллетлар
1
Спасибо, Эллетлар, я отредактировал свой ответ, я обязательно отвечу более подробно: D
Ага Саад
1
import os

total_con=os.listdir('<directory path>')

files=[]

for f_n in total_con:
   if os.path.isfile(f_n):
     files.append(f_n)


print len(files)
Мохит Дабас
источник
ОП запросил количество файлов , в нем также перечислены каталоги.
Коре
1

Если вы будете использовать стандартную оболочку операционной системы, вы можете получить результат гораздо быстрее, чем с использованием чисто питонического способа.

Пример для Windows:

import os
import subprocess

def get_num_files(path):
    cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
    return int(subprocess.check_output(cmd, shell=True))
стайлер
источник
1
Но это не будет так портативно.
Политанк-Z
1

Я нашел другой ответ, который может быть правильным как принятый ответ.

for root, dirs, files in os.walk(input_path):    
for name in files:
    if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
        datafiles.append(os.path.join(root,name)) 


print len(files) 
Ismail
источник
0

Я использовал glob.iglobдля структуры каталогов, аналогичных

data
└───train
   └───subfolder1
   |      file111.png
   |      file112.png
   |      ...
   |
   └───subfolder2
          file121.png
          file122.png
          ...
└───test
       file221.png
       file222.png

Обе из следующих опций возвращают 4 (как и ожидалось, т.е. не учитывают сами подпапки )

  • len(list(glob.iglob("data/train/*/*.png", recursive=True)))
  • sum(1 for i in glob.iglob("data/train/*/*.png"))
user799188
источник
0

я сделал это, и это вернуло количество файлов в папке (Attack_Data) ... это работает отлично.

import os
def fcount(path):
    #Counts the number of files in a directory
    count = 0
    for f in os.listdir(path):
        if os.path.isfile(os.path.join(path, f)):
            count += 1

    return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))
Сэм Экоро
источник