在遍历多个文件名的同时查找特定的子字符串

Question

在遍历文件时，我需要找到大量文件的标识号。

文件名将加载到列表中，如下所示：

ID322198.nii
ID9828731.nii
ID23890.nii
FILEID988312.nii

因此，解决此问题的最佳方法是找到位于ID和.nii之间的.nii

因为位数不同，所以我不能简单地选择文件名的[-10:-4] 。 有任何想法吗？

Answer 1

要找到ID和.nii的位置，可以使用python的index()函数

for line in file:
    idpos = 
    nilpos = 
    data =

或作为整数列表：

[ int(line[line.index("ID")+1:line.index(".nii")]) for line in file ]

Answer 2

您可以使用正则表达式（在此处查看实际操作）：

import re

files = ['ID322198.nii','ID9828731.nii','ID23890.nii','FILEID988312.nii']

[re.findall(r'ID(\d+)\.nii', file)[0] for file in files]

返回值：

['322198', '9828731', '23890', '988312']

Answer 3

使用rindex ：

s = 'ID322198.nii'
s = s[s.rindex('D')+1 : s.rindex('.')]
print(s)

返回值：

然后将此正弦值应用于字符串列表。

Answer 4

for name in files:
    name = name.replace('.nii', '')
    id_num = name.replace(name.rstrip('0123456789'), '')

工作原理：

# example
name = 'ID322198.nii'

# remove '.nii'. -> name1 = 'ID322198'
name1 = name.replace('.nii', '') 

# strip all digits from the end. -> name2 = 'ID'
name2 = name1.rstrip('0123456789') 

# remove 'ID' from 'ID322198'. -> id_num = '322198'
id_num = name1.replace(name2, '')

Answer 5

看来您可以过滤出数字，如下所示：

digits = ''.join(d for d in filename if d.isdigit())

只要文件名中没有其他数字（例如带.1后缀的备份或类似的东西），该方法就可以很好地工作。

在遍历多个文件名的同时查找特定的子字符串

问题描述

5 个解决方案

解决方案1
1 2018-12-14 19:36:05

解决方案2
1 已采纳 2018-12-14 19:39:08

解决方案3
0 2018-12-14 19:41:19

解决方案4
0 2018-12-14 19:41:50

解决方案5
0 2018-12-14 19:42:37

在遍历多个文件名的同时查找特定的子字符串

问题描述

5 个解决方案

解决方案1 1 2018-12-14 19:36:05

解决方案2 1 已采纳 2018-12-14 19:39:08

解决方案3 0 2018-12-14 19:41:19

解决方案4 0 2018-12-14 19:41:50

解决方案5 0 2018-12-14 19:42:37

解决方案1
1 2018-12-14 19:36:05

解决方案2
1 已采纳 2018-12-14 19:39:08

解决方案3
0 2018-12-14 19:41:19

解决方案4
0 2018-12-14 19:41:50

解决方案5
0 2018-12-14 19:42:37