繁体   English   中英

正则表达式返回两个特殊字符之间的所有字符

[英]Regular expression to return all characters between two special characters

我如何使用regx返回两个括号之间的所有字符。 这是一个例子:

foobar['infoNeededHere']ddd
needs to return infoNeededHere

我在大括号之间找到了一个正则表达式,但所有尝试使用方括号的尝试都失败了。 这是正则表达式: (?<={)[^}]*(?=})这是我试图破解它

(?<=[)[^}]*(?=])

最终解决方案

import re

str = "foobar['InfoNeeded'],"
match = re.match(r"^.*\['(.*)'\].*$",str)
print match.group(1)

如果您是REG (gular) EX (新闻)的新手,您可以在Python Docs中了解它们。 或者,如果您想要更温和的介绍,可以查看HOWTO 他们使用Perl风格的语法。

正则表达式

你需要的表达式是.*?\\[(.*)\\].* 你想要的小组将是\\1
- .*? . 匹配任何字符,但换行。 *是元字符,表示重复此次0次或更多次 ? 使*非贪婪,即. 在击中'['之前,将尽可能少的字符匹配。
- \\[ \\转义特殊元字符,在本例中为[ 如果我们不这样做, [会做一些非常奇怪的事情。
- (.*) 括号'分组'其中的任何内容,您可以稍后通过其数字ID或名称检索组(如果它们被赋予一个)。
- \\].* 你现在应该足够了解这意味着什么。

履行

首先,将re模块 - 它不是内置的 - 导入到你想要使用表达式的地方。

然后,使用re.search(regex_pattern, string_to_be_tested)搜索要测试的字符串中的模式。 这将返回一个MatchObject ,您可以将其存储到临时变量中。 然后,您应该调用它的group()方法并将1作为参数传递(以查看我们之前使用括号捕获的“组1”)。 我现在应该看起来像:

>>> import re
>>> pat = r'.*?\[(.*)].*'             #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd"
>>> match = re.search(pat, s)
>>> match.group(1)
"'infoNeededHere'"

替代

您还可以使用findall()通过将正则表达式修改为(?>=\\[).+?(?=\\])来查找所有非重叠匹配。
- (?<=\\[) : (?<=)被称为后视断言并检查实际匹配之前的表达式。
- .+? +就像*只是它匹配一个或多个repititions。 它是非贪婪的?
- (?=\\]) (?=)前瞻判断和检查表达式跟随比赛的w / o捕获它。
您的代码现在应该如下所示:

>>> import re
>>> pat = r'(?<=\[).+?(?=\])'  #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd[andHere] [andOverHereToo[]"
>>> re.findall(pat, s)
["'infoNeededHere'", 'andHere', 'andOverHereToo['] 

注意:始终使用原始Python字符串,在字符串前添加“r”(例如: r'blah blah blah' )。

10倍阅读! 当没有被接受的时候我写了这个答案,但是当我完成它的时候,有2个矿石出现了,一个被接受了。 :( x <

^.*\\['(.*)'\\].*$将匹配一行并捕获组中的内容。

你必须逃避[]\\

rubular.com 证明链接中的文档将解释表达式是如何形成的。

如果每行只有一个[.....]标记,那么你根本不需要使用正则表达式:

In [7]: mystring = "Bacon, [eggs], and spam"

In [8]: mystring[ mystring.find("[")+1 : mystring.find("]") ]
Out[8]: 'eggs'

如果每行不止一个,那么你需要修改Jarrod的正则表达式^.*\\['(.*)'\\].*$以匹配每行多次,并且非贪婪。 (使用.*?量词而不是.*量词。)

In [15]: mystring = "[Bacon], [eggs], and [spam]."

In [16]: re.findall(r"\[(.*?)\]",mystring)
Out[16]: ['Bacon', 'eggs', 'spam']

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM