简体   繁体   English

使用正则表达式在Python中grep字符串

[英]Using regex to grep a string in Python

I am trying to grep two kinds of patterns in a list using re in python: 我正在尝试使用python中的re在列表中grep两种模式:

'<xyz>number followed by optional *</xyz>'
'name="namepad">number</xyz>

Using regex in python, I am not able to get the data with asterisk. 在python中使用正则表达式,我无法使用星号获取数据。 Here is a sample session, what can I do so that the filter also returns the first element? 这是一个示例会话,该如何做才能使过滤器还返回第一个元素?

>>> k = ['<xyz>27*</xyz>', 'name="namePad">22</xyz>']
>>> f = filter(lambda x:re.search('^name="namePad"|^<xyz>[0-9]{1,3}\*"  <\/xyz>',x), k)
>>> f
['name="namePad">22</xyz>']

Your regex has mismatched " quotes. Try this: 您的正则表达式不匹配"引号。请尝试以下操作:

filter(lambda x:re.search(r'^name="namePad"|^<xyz>[\d]{1,3}\*?</xyz>',x), k)

It will give you the following: 它会为您提供以下内容:

['27*', 'name="namePad">22'] ['27 *','name =“ namePad”> 22']

You can use re.match since to check for a match only at the beginning of the string. 您可以使用re.match因为仅在字符串的开头检查匹配项。 Also you don't need filter use list comprehensions instead. 同样,您也不需要过滤器使用列表推导。

>>> [i for i in k if re.match(r'(<xyz>|name="namePad">)\d+\*?', i)]
['<xyz>27*</xyz>', 'name="namePad">22</xyz>']

The ? ? after * mean that * is optional you can read more about quantifiers Here *后面的*表示*是可选的,您可以在此处阅读有关量词的更多信息

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM