[英]How to match beginning of string or character in Python
我有一个由参数号_参数号组成的字符串:
dir = 'a1.8000_b1.0000_cc1.3000_al0.209_be0.209_c1.344_e0.999'
我需要在选择的参数后面得到数字,即
par='be'
- >需要0.209 par='e'
- >需要0.999 我试过了:
num1 = float(re.findall(par + '(\d+\.\d*)', dir)[0])
但是对于par='e'
这将匹配0.209
和 0.999
,所以我尝试将参数与字符串的开头或下划线匹配:
num1 = float(re.findall('[^_]'+par+'(\d+\.\d*)', dir)[0])
由于某种原因不起作用。
有什么建议么? 谢谢!
您的[^_]
模式匹配任何不是下划线的字符 。
使用(..|..)
或分组:
float(re.findall('(?:^|_)' + par + r'(\d+\.\d*)', dir)[0])
我在那里使用了一个(?:..)
非捕获组,这样它就不会干扰你原来的组索引。
演示:
>>> import re
>>> dir = 'a1.8000_b1.0000_cc1.3000_al0.209_be0.209_c1.344_e0.999'
>>> par = 'e'
>>> re.findall('(?:^|_)' + par + r'(\d+\.\d*)', dir)
['0.999']
>>> par = 'a'
>>> re.findall('(?:^|_)' + par + r'(\d+\.\d*)', dir)
['1.8000']
详细说明,当使用字符组( [..]
)并使用插入符号( ^
) 启动该组时,您将反转字符组,将其从匹配列出的字符转换为匹配其他所有字符组:
>>> re.findall('[a]', 'abcd')
['a']
>>> re.findall('[^a]', 'abcd')
['b', 'c', 'd']
没有regex
解决方案:
def func(par,strs):
ind=strs.index('_'+par)+1+len(par)
ind1=strs.find('_',ind) if strs.find('_',ind)!=-1 else len(strs)
return strs[ind:ind1]
输出:
>>> func('be',dir)
'0.209'
>>> func('e',dir)
'0.999'
>>> func('cc',dir)
'1.3000'
没有正则表达式的解决方案:
>>> def get_value(dir, parm):
... return map(float, [t[len(parm):] for t in dir.split('_') if t.startswith(parm)])
...
>>> get_value('a1.8000_b1.0000_cc1.3000_al0.209_be0.209_c1.344_e0.999', "be")
[0.20899999999999999]
如果字符串中出现多次参数,则会评估所有参数。
并且没有强制转换为浮点数的版本:
return [t[len(parm):] for t in dir.split('_') if t.startswith(parm)]
(?P<param>[a-zA-Z]*)(?P<version>[^_]*)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.