[英]How to search/extract patterns in a string?
我有一个要在邮件中搜索的模式。 模式是:
1. "aaa-b3-c"
2. "a3-b6-c"
3. "aaaa-bb-c"
我知道如何搜索其中一种模式,但是如何搜索所有3种模式?
另外,您如何识别和提取以下格式的日期:5/21或5/21/2019。
found = re.findall(r'.{3}-.{2}-.{1}', message)
尝试这个 :
found = re.findall(r'a{2,4}-b{2}-c', message)
你可以用
a{2,4}-bb-c
作为一种模式。
if (match := re.search(pattern, string)) is not None:
# do sth. here
从Python 3.8
您可以像下面一样使用walrus
运算符
if (match := re.search(pattern, string)) is not None: # do sth. here
尝试这个:
re.findall(r'a.*-b.*-c',message)
在这里,我们可能只想编写三个表达式,然后从左向右滑动我们的输入以确保安全并使用逻辑或将它们连接起来,如果我们有更多的模式,我们可以简单地添加到其中,类似于:
([a-z]+-[a-z]+[0-9]+-[a-z]+)
([a-z]+[0-9]+-[a-z]+[0-9]+-[a-z])
([a-z]+-[a-z]+-[a-z])
这将增加:
([a-z]+-[a-z]+[0-9]+-[a-z]+)|([a-z]+[0-9]+-[a-z]+[0-9]+-[a-z])|([a-z]+-[a-z]+-[a-z])
然后,我们可能希望将其与开始和结束字符绑定:
^([a-z]+-[a-z]+[0-9]+-[a-z]+)$|^([a-z]+[0-9]+-[a-z]+[0-9]+-[a-z])$|^([a-z]+-[a-z]+-[a-z])$
要么
^(([a-z]+-[a-z]+[0-9]+-[a-z]+)|([a-z]+[0-9]+-[a-z]+[0-9]+-[a-z])|([a-z]+-[a-z]+-[a-z]))$
如果不需要此表达式,则可以在regex101.com中对其进行修改或更改。
jex.im可视化正则表达式:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.