为什么此正则表达式在此字符串中不匹配？

Question

我希望能够使用正则表达式替换文件中的字符串。 但是我的功能找不到匹配项。 所以我模拟了一个测试来复制正在发生的事情。

我已经定义了要替换的字符串，如下所示：

string = 'buf = O_strdup("ONE=001&TYPE=PUZZLE&PREFIX=EXPRESS&");'

我想用其他东西代替“ TYPE = PUZZLE＆PREFIX = EXPRESS＆”部分。 NB。 该字符串在原始文件中并不总是完全包含“ PUZZLE”和“ PREFIX”，但是将采用该格式）。

因此，首先我尝试测试是否获得正确的匹配。

 obj = re.search(r'TYPE=([\^&]*)\&PREFIX=([\^&]*)\&', string)
 if obj:
    print obj.group()
 else:
    print "No match!!"

认为([\\^&]*)可以匹配任意数量的非与号字符。 但是我总是得到“没有比赛！”。

但是， obj = re.search(r'TYPE=([\\^&]*)', string)

返回我“ TYPE =“

为什么我的第一个不工作？

Answer 1

由于^符号用\\进行转义，因此以下部分： ([\\^&]*)匹配以下字符的任何序列：^，＆。

尝试将其替换为([^&]*) 。

Answer 2

在我的正则表达式测试器中，它确实起作用： 'TYPE=(.*)\\&PREFIX=(.*)\\&'

Answer 3

试试这个

obj = re.search(r'TYPE=(?P<type>[^&]*?)&PREFIX=(?P<prefix>[^&]*?)&', string)

?P<some_name>是一个命名的捕获组，使访问捕获的组obj.group("type") -->> 'PUZZLE'更加容易

Answer 4

最好使用函数urlparse.parse_qsl()和urllib.urlencode()代替正则表达式。 该代码将不那么容易出错：

from urlparse import parse_qsl
from urllib import urlencode
s = "ONE=001&TYPE=PUZZLE&PREFIX=EXPRESS&"
a = parse_qsl(s)
d = dict(TYPE="a", PREFIX="b")
print urlencode(list((key, d.get(key, val)) for key, val in a))
# ONE=001&TYPE=a&PREFIX=b

为什么此正则表达式在此字符串中不匹配？

问题描述

4 个解决方案

解决方案1
5 已采纳 2011-02-01 09:57:59

解决方案2
1 2011-02-01 10:00:22

解决方案3
0 2011-02-01 10:05:45

解决方案4
0 2011-02-01 10:11:29

为什么此正则表达式在此字符串中不匹配？

问题描述

4 个解决方案

解决方案1 5 已采纳 2011-02-01 09:57:59

解决方案2 1 2011-02-01 10:00:22

解决方案3 0 2011-02-01 10:05:45

解决方案4 0 2011-02-01 10:11:29

解决方案1
5 已采纳 2011-02-01 09:57:59

解决方案2
1 2011-02-01 10:00:22

解决方案3
0 2011-02-01 10:05:45

解决方案4
0 2011-02-01 10:11:29