生成要在 re.match() 中使用的正则表达式字符串

Question

我正在尝试将字符串用作正则表达式字符串。
在以下代码中：
_pattern是一种类似于abba的模式，我正在尝试检查_string遵循_pattern （例如catdogdogcat ）

以下代码中的rxp是我试图创建以匹配_string的正则表达式（例如，对于上面的示例，它将是(.+)(.+)\\\\2\\\\1 ）。 正在成功生成。 但是re.match()正在返回None 。

我想了解为什么它不起作用以及如何纠正它？

import re

_pattern = "abba" #raw_input().strip()
_string = "catdogdogcat" #raw_input().strip()
hm = {}
rxp = ""
c = 1
for x in _pattern:
    if hm.has_key(x):
        rxp += hm[x]
        continue
    else:
        rxp += "(.+)"
        hm[x]="\\\\"+str(c)
        c+=1

print rxp
#print re.match(rxp,_string) -> (Tried)  Not working
#print re.match(r'rxp', _string) -> (Tried) Not working

print re.match(r'%s' %rxp, _string) # (Tried) Not working

输出
(.+)(.+)\\\\2\\\\1 None

预期产出
(.+)(.+)\\\\2\\\\1 <_sre.SRE_Match object at 0x000000000278FE88>

Answer 1

问题是您的正则表达式字符串变量有双\\\\而不是一个。

您可以使用

rxp.replace("\\\\", "\\")

在.match是这样的：

>>> print re.match(rxp.replace("\\\\", "\\"), _string)
<_sre.SRE_Match object at 0x10bf87c68>

>>> print re.match(rxp.replace("\\\\", "\\"), _string).groups()
('cat', 'dog')

编辑：

您还可以避免像这样获得双\\\\ ：import re

_pattern = "abba" #raw_input().strip()
_string = "catdogdogcat" #raw_input().strip()
hm = {}
rxp = ""
c = 1
for x in _pattern:
    if x in hm:
        rxp += hm[x]
        continue
    else:
        rxp += "(.+)"
        hm[x]="\\" + str(c)
        c+=1

print rxp
print re.match(rxp,_string)

Answer 2

您应该使用字符串格式，而不是将rxp硬编码到字符串中：

print re.match(r'%s'%rxp, _string)

生成要在 re.match() 中使用的正则表达式字符串

问题描述

2 个解决方案

解决方案1
1 已采纳 2016-09-27 14:40:42

解决方案2
0 2016-09-27 14:05:28

生成要在 re.match() 中使用的正则表达式字符串

问题描述

2 个解决方案

解决方案1 1 已采纳 2016-09-27 14:40:42

解决方案2 0 2016-09-27 14:05:28

解决方案1
1 已采纳 2016-09-27 14:40:42

解决方案2
0 2016-09-27 14:05:28