我需要使用 Python 计算目录中的文件数。
我想最简单的方法是len(glob.glob('*'))
,但这也将目录本身视为一个文件。
有没有办法只计算目录中的文件?
os.listdir()
会比使用glob.glob
. 要测试文件名是否是普通文件(而不是目录或其他实体),请使用os.path.isfile()
:
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
import os
path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
对于所有类型的文件,子目录包括:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
只有文件(避免子目录):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
这是 fnmatch 非常方便的地方:
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
如果要计算目录中的所有文件-包括子目录中的文件,最pythonic的方法是:
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
我们使用比显式添加文件计数更快的总和(时间待定)
我很惊讶没有人提到os.scandir
:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
import os
print len(os.listdir(os.getcwd()))
def directory(path,extension):
list_dir = []
list_dir = os.listdir(path)
count = 0
for file in list_dir:
if file.endswith(extension): # eg: '.txt'
count += 1
return count
简短而简单
import os
directory_path = '/home/xyz/'
No_of_files = len(os.listdir(directory_path))
这使用os.listdir
并适用于任何目录:
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
这可以通过生成器进行简化,并通过以下方式加快速度:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
虽然我同意@DanielStutzbach 提供的答案:os.listdir()
将比使用glob.glob
.
但是,如果您确实想计算文件夹中特定文件的数量,则需要额外的精度,您想使用len(glob.glob())
. 例如,如果您要计算要使用的文件夹中的所有 pdf:
pdfCounter = len(glob.glob1(myPath,"*.pdf"))
使用 pathlib 的答案并且没有将整个列表加载到内存中:
from pathlib import Path
path = Path('.')
print(sum(1 for _ in path.glob('*'))) # Files and folders, not recursive
print(sum(1 for _ in path.glob('**/*'))) # Files and folders, recursive
print(sum(1 for x in path.glob('*') if x.is_file())) # Only files, not recursive
print(sum(1 for x in path.glob('**/*') if x.is_file())) # Only files, recursive
def count_em(valid_path):
x = 0
for root, dirs, files in os.walk(valid_path):
for f in files:
x = x+1
print "There are", x, "files in this directory."
return x
取自这篇文章
这是一个简单的解决方案,可以计算包含子文件夹的目录中的文件数。它可能会派上用场:
import os
from pathlib import Path
def count_files(rootdir):
'''counts the number of files in each subfolder in a directory'''
for path in pathlib.Path(rootdir).iterdir():
if path.is_dir():
print("There are " + str(len([name for name in os.listdir(path) \
if os.path.isfile(os.path.join(path, name))])) + " files in " + \
str(path.name))
count_files(data_dir) # data_dir is the directory you want files counted.
您应该得到与此类似的输出(当然,占位符已更改):
There are {number of files} files in {name of sub-folder1}
There are {number of files} files in {name of sub-folder2}
import os
def count_files(in_directory):
joiner= (in_directory + os.path.sep).__add__
return sum(
os.path.isfile(filename)
for filename
in map(joiner, os.listdir(in_directory))
)
>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049
卢克的代码重新格式化。
import os
print len(os.walk('/usr/lib').next()[2])
这是一个我发现有用的简单的单行命令:
print int(os.popen("ls | wc -l").read())
一个班轮和递归:
def count_files(path):
return sum([len(files) for _, _, files in os.walk(path)])
count_files('path/to/dir')
我用于glob.iglob
类似的目录结构
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
以下两个选项都返回 4 (如预期的那样,即不计算子文件夹本身)
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
很简单:
print(len([iq for iq in os.scandir('PATH')]))
它只是计算目录中的文件数,我使用列表理解技术遍历特定目录,返回所有文件作为回报。"len(returned list)" 返回文件数。
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
如果您将使用操作系统的标准 shell,则可以更快地获得结果,而不是使用纯 Python 方式。
Windows 示例:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
我找到了另一个答案,它可能作为公认的答案是正确的。
for root, dirs, files in os.walk(input_path):
for name in files:
if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
datafiles.append(os.path.join(root,name))
print len(files)
我这样做了,这返回了文件夹中的文件数(Attack_Data)......这很好用。
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))
我在通过 Google Colab 将自己引导到目录文件夹中计算 google drive 目录中的文件数量时解决了这个问题
import os
%cd /content/drive/My Drive/
print(len([x for x in os.listdir('folder_name/']))
普通用户可以试试
import os
cd Desktop/Maheep/
print(len([x for x in os.listdir('folder_name/']))
我编写的一个简单的实用函数,它使用os.scandir()
代替os.listdir()
。
import os
def count_files_in_dir(path: str) -> int:
file_entries = [entry for entry in os.scandir(path) if entry.is_file()]
return len(file_entries)
主要的好处是,os.path.is_file()
消除了对实例的需求,并用实例替换了os.DirEntry
实例is_file()
,这也消除了对os.path.join(DIR, file_name)
其他答案所示的需求。
转换为列表之后你可以 Len
len(list(glob.glob('*')))
更简单的一个:
import os
number_of_files = len(os.listdir(directory))
print(number_of_files)