0

我有一个二进制文件的集合,它们的名称如下:

d010-recomb.bin
d011-recomb.bin
.............
.............
.............
d100-recomb.bin

使用 python glob 模块,我可以访问文件夹中的所有文件,并可以对这些文件进行进一步处理:

import glob
binary = sorted(glob.glob('C:/Users/Desktop/bin/*.bin')) 

我还可以对要访问的文件使用一些标准:

例如,如果我使用以下代码,那么我将可以访问从 d010-recomb.bin 到 d01​​9-recomb.bin 的所有文件

binary = sorted(glob.glob('C:/Users/Desktop/bin/d01*.bin'))

但是使用这个标准,我无法访问 d015 到 d025 等文件。

告诉我如何才能访问这些文件。

4

3 回答 3

1

您可以使用以下方式过滤列表:

def filter_path(path,l,r):
    i = int(os.path.basename(path)[1:4])
    if (i >= l) and (i <= r):
        return True
    return False

result = [i for i in binary if filter_path(i,19,31)]

如果您对目录中的元素数量有 100% 的信心,您可以:

result = binary[19:30]

或者,一旦您对数据进行了排序,您可能会找到第一个索引最后一个索引以及[1] [2]

l = binary.find('C:/Users/Desktop/bin/d015.bin')
r = binary.find('C:/Users/Desktop/bin/d023.bin')
result = binary[l:r+1]
于 2013-05-27T08:46:25.983 回答
0

之后过滤列表;将文件名部分转换为int或创建要包含的字符串范围:

included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set

binary = sorted(f for f in glob.glob('C:/Users/Desktop/bin/*.bin') if f[21:25] in included) 

上面的代码'd015' 通过 to生成字符串'd025'作为一组用于快速成员资格测试的字符串,然后针对该集合测试每个文件的前 4 个字符;因为glob()返回整个文件名,所以我们切掉了它的工作路径。

对于可变路径,我会根据路径存储切片偏移量以提高速度:

pattern = 'C:/Users/Desktop/bin/*.bin'
included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set
offset = len(os.path.dirname(pattern)) + 1

binary = sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included) 

后者的演示:

$ mkdir test
$ touch test/d014-recomb.bin
$ touch test/d015-recomb.bin
$ touch test/d017-recomb.bin
$ touch test/d018-recomb.bin
$ fg
bin/python2.7
>>> import os, glob
>>> pattern = '/tmp/stackoverflow/test/*.bin'
>>> included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set
>>> offset = len(os.path.dirname(pattern)) + 1
>>> sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included)
['/tmp/stackoverflow/test/d015-recomb.bin', '/tmp/stackoverflow/test/d017-recomb.bin', '/tmp/stackoverflow/test/d018-recomb.bin']
于 2013-05-27T08:31:53.310 回答
0

您可能必须手动添加此限制,因为它无法通过 glob 模式完成。

如果您确切知道文件名是如何构建的,您可以这样做

import os
for i in range(19, 34): # 19 to 33
    filename = "d%03d-recomb.bin" % i
    if os.path.exists(os.path.join('C:/Users/Desktop/bin', filename)):
        print filename
于 2013-05-27T08:31:59.980 回答