繁体   English   中英

python正则表达式搜索模式

[英]python regex search pattern

我正在搜索一段换行符后跟一个句点的文本。

pat = '\n\.'
block = 'Some stuff here. And perhaps another sentence here.\n.Some more text.'

由于某种原因,当我使用正则表达式搜索模式时,它会更改pat的值(使用Python 2.7)。

import re
mysrch = re.search(pat, block)

现在pat的值已更改为:

'\n\\.'

这与我使用pat进行的下一次搜索搞混了。 为什么会发生这种情况,我该如何避免呢?

提前非常感谢。

多余的斜杠实际上不是字符串的一部分-字符串本身完全没有改变。

这是一个例子:

>>> pat = '\n\.'
>>> pat
'\n\\.'
>>> print pat

\.

如您所见,当您打印pat时,其中只有一个\\ 当您转储字符串的值时,它将使用__repr__函数,该函数旨在清楚地向您显示字符串中的内容,因此它向您显示字符的转义版本。 就像\\n是换行符的转义版本一样, \\\\\\的转义版本。

您的正则表达式可能与您的期望不符,因为其中有一个实际的换行符,而不是文字字符串"\\n" (作为代表: "\\\\n" )。

您应该使正则表达式成为原始字符串(如注释中所建议)。

>>> pat = r"\n\."
>>> pat
'\\n\\.'
>>> print pat
\n\.

或者您可以逃脱斜线并使用

pat = "\\n\\."

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM