[英]regex ignore some characters when searching
我希望能够匹配字符串中的 substring,但我希望我的搜索对插入原始字符串中的一些预定义字符具有鲁棒性。 举个例子:
string = "This is a text containing several sentences. This is a first test string\n\n. This test string should also be matched\t."
substring = "This is a first test string. This test string should also be matched."
我想在原始字符串中返回 substring 的索引(通常是re.search(substring, string, re.IGNORECASE).spans()
)
搜索时如何忽略这些元字符(\n、\t)?
在执行find
之前从string
中删除\n
和\t
。 您不需要执行re.search
:
>>> re.sub(r'[\n\t]+', '', string).lower().find(substring.lower())
45
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.