[英]python access selective files with glob module
我有一个二进制文件集合,其名称如下:
d010-recomb.bin
d011-recomb.bin
.............
.............
.............
d100-recomb.bin
使用python glob模块,我可以访问文件夹中的所有文件,并可以对这些文件进行进一步处理:
import glob
binary = sorted(glob.glob('C:/Users/Desktop/bin/*.bin'))
我还可以对要访问的文件使用一些条件:
例如,如果我使用以下代码,则可以访问从d010-recomb.bin到d019-recomb.bin的所有文件
binary = sorted(glob.glob('C:/Users/Desktop/bin/d01*.bin'))
但是使用此标准,我无法访问d015至d025之类的文件。
请告诉我我该怎么做才能访问这些文件。
您可以使用以下方法过滤列表:
def filter_path(path,l,r):
i = int(os.path.basename(path)[1:4])
if (i >= l) and (i <= r):
return True
return False
result = [i for i in binary if filter_path(i,19,31)]
如果您对目录中的元素数量有100%的信心,则可以:
result = binary[19:30]
或者,对数据进行排序后,您可能会发现第一个索引和最后一个索引以及[1] [2] :
l = binary.find('C:/Users/Desktop/bin/d015.bin')
r = binary.find('C:/Users/Desktop/bin/d023.bin')
result = binary[l:r+1]
之后过滤列表; 将文件名部分转换为int
或创建要包含的字符串范围:
included = {'d{:03d}'.format(i) for i in range(15, 26)} # a set
binary = sorted(f for f in glob.glob('C:/Users/Desktop/bin/*.bin') if f[21:25] in included)
上面的代码将字符串'd015'
到'd025'
成为一组字符串,以进行快速成员资格测试,然后针对该文件集测试每个文件的前4个字符; 因为glob()
返回整个文件名,所以我们将其切掉了。
对于可变路径,我将基于路径存储切片偏移量以提高速度:
pattern = 'C:/Users/Desktop/bin/*.bin'
included = {'d{:03d}'.format(i) for i in range(15, 26)} # a set
offset = len(os.path.dirname(pattern)) + 1
binary = sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included)
后者的演示:
$ mkdir test
$ touch test/d014-recomb.bin
$ touch test/d015-recomb.bin
$ touch test/d017-recomb.bin
$ touch test/d018-recomb.bin
$ fg
bin/python2.7
>>> import os, glob
>>> pattern = '/tmp/stackoverflow/test/*.bin'
>>> included = {'d{:03d}'.format(i) for i in range(15, 26)} # a set
>>> offset = len(os.path.dirname(pattern)) + 1
>>> sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included)
['/tmp/stackoverflow/test/d015-recomb.bin', '/tmp/stackoverflow/test/d017-recomb.bin', '/tmp/stackoverflow/test/d018-recomb.bin']
您可能必须手动添加此限制,因为它无法通过全局模式来完成。
如果您完全知道文件名的构建方式,则可以
import os
for i in range(19, 34): # 19 to 33
filename = "d%03d-recomb.bin" % i
if os.path.exists(os.path.join('C:/Users/Desktop/bin', filename)):
print filename
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.