簡體   English   中英

python使用glob模塊訪問選擇性文件

[英]python access selective files with glob module

我有一個二進制文件集合,其名稱如下:

d010-recomb.bin
d011-recomb.bin
.............
.............
.............
d100-recomb.bin

使用python glob模塊,我可以訪問文件夾中的所有文件,並可以對這些文件進行進一步處理:

import glob
binary = sorted(glob.glob('C:/Users/Desktop/bin/*.bin')) 

我還可以對要訪問的文件使用一些條件:

例如,如果我使用以下代碼,則可以訪問從d010-recomb.bin到d019-recomb.bin的所有文件

binary = sorted(glob.glob('C:/Users/Desktop/bin/d01*.bin'))

但是使用此標准,我無法訪問d015至d025之類的文件。

告訴我我該怎么做才能訪問這些文件。

您可以使用以下方法過濾列表:

def filter_path(path,l,r):
    i = int(os.path.basename(path)[1:4])
    if (i >= l) and (i <= r):
        return True
    return False

result = [i for i in binary if filter_path(i,19,31)]

如果您對目錄中的元素數量有100%的信心,則可以:

result = binary[19:30]

或者,對數據進行排序后,您可能會發現第一個索引最后一個索引以及[1] [2]

l = binary.find('C:/Users/Desktop/bin/d015.bin')
r = binary.find('C:/Users/Desktop/bin/d023.bin')
result = binary[l:r+1]

之后過濾列表; 將文件名部分轉換為int或創建要包含的字符串范圍:

included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set

binary = sorted(f for f in glob.glob('C:/Users/Desktop/bin/*.bin') if f[21:25] in included) 

上面的代碼將字符串'd015''d025'成為一組字符串,以進行快速成員資格測試,然后針對該文件集測試每個文件的前4個字符; 因為glob()返回整個文件名,所以我們將其切掉了。

對於可變路徑,我將基於路徑存儲切片偏移量以提高速度:

pattern = 'C:/Users/Desktop/bin/*.bin'
included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set
offset = len(os.path.dirname(pattern)) + 1

binary = sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included) 

后者的演示:

$ mkdir test
$ touch test/d014-recomb.bin
$ touch test/d015-recomb.bin
$ touch test/d017-recomb.bin
$ touch test/d018-recomb.bin
$ fg
bin/python2.7
>>> import os, glob
>>> pattern = '/tmp/stackoverflow/test/*.bin'
>>> included = {'d{:03d}'.format(i) for i in range(15, 26)}  # a set
>>> offset = len(os.path.dirname(pattern)) + 1
>>> sorted(f for f in glob.glob(pattern) if f[offset:offset + 4] in included)
['/tmp/stackoverflow/test/d015-recomb.bin', '/tmp/stackoverflow/test/d017-recomb.bin', '/tmp/stackoverflow/test/d018-recomb.bin']

您可能必須手動添加此限制,因為它無法通過全局模式來完成。

如果您完全知道文件名的構建方式,則可以

import os
for i in range(19, 34): # 19 to 33
    filename = "d%03d-recomb.bin" % i
    if os.path.exists(os.path.join('C:/Users/Desktop/bin', filename)):
        print filename

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM