正则表达式返回两个特殊字符之间的所有字符

Question

我如何使用regx返回两个括号之间的所有字符。 这是一个例子：

foobar['infoNeededHere']ddd
needs to return infoNeededHere

我在大括号之间找到了一个正则表达式，但所有尝试使用方括号的尝试都失败了。 这是正则表达式： (?<={)[^}]*(?=})这是我试图破解它

(?<=[)[^}]*(?=])

最终解决方案

import re

str = "foobar['InfoNeeded'],"
match = re.match(r"^.*\['(.*)'\].*$",str)
print match.group(1)

Answer 1

如果您是REG （gular） EX （新闻）的新手，您可以在Python Docs中了解它们。 或者，如果您想要更温和的介绍，可以查看HOWTO 。 他们使用Perl风格的语法。

正则表达式

你需要的表达式是.*?\\[(.*)\\].* 。 你想要的小组将是\\1 。
- .*? ： . 匹配任何字符，但换行。 *是元字符，表示重复此次0次或更多次 。 ? 使*非贪婪，即. 在击中'['之前，将尽可能少的字符匹配。
- \\[ ： \\转义特殊元字符，在本例中为[ 。 如果我们不这样做， [会做一些非常奇怪的事情。
- (.*) ：括号'分组'其中的任何内容，您可以稍后通过其数字ID或名称检索组（如果它们被赋予一个）。
- \\].* ：你现在应该足够了解这意味着什么。

履行

首先，将re模块 - 它不是内置的 - 导入到你想要使用表达式的地方。

然后，使用re.search(regex_pattern, string_to_be_tested)搜索要测试的字符串中的模式。 这将返回一个MatchObject ，您可以将其存储到临时变量中。 然后，您应该调用它的group()方法并将1作为参数传递（以查看我们之前使用括号捕获的“组1”）。 我现在应该看起来像：

>>> import re
>>> pat = r'.*?\[(.*)].*'             #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd"
>>> match = re.search(pat, s)
>>> match.group(1)
"'infoNeededHere'"

替代

您还可以使用findall()通过将正则表达式修改为(?>=\\[).+?(?=\\])来查找所有非重叠匹配。
- (?<=\\[) : (?<=)被称为后视断言并检查实际匹配之前的表达式。
- .+? ： +就像*只是它匹配一个或多个repititions。 它是非贪婪的? 。
- (?=\\]) (?=)是前瞻判断和检查表达式跟随比赛的w / o捕获它。
您的代码现在应该如下所示：

>>> import re
>>> pat = r'(?<=\[).+?(?=\])'  #See Note at the bottom of the answer
>>> s = "foobar['infoNeededHere']ddd[andHere] [andOverHereToo[]"
>>> re.findall(pat, s)
["'infoNeededHere'", 'andHere', 'andOverHereToo[']

注意：始终使用原始Python字符串，在字符串前添加“r”（例如： r'blah blah blah' ）。

10倍阅读！ 当没有被接受的时候我写了这个答案，但是当我完成它的时候，有2个矿石出现了，一个被接受了。 :( x <

Answer 2

^.*\\['(.*)'\\].*$将匹配一行并捕获组中的内容。

你必须逃避[和]与\\

rubular.com 证明链接中的文档将解释表达式是如何形成的。

Answer 3

如果每行只有一个[.....]标记，那么你根本不需要使用正则表达式：

In [7]: mystring = "Bacon, [eggs], and spam"

In [8]: mystring[ mystring.find("[")+1 : mystring.find("]") ]
Out[8]: 'eggs'

如果每行不止一个，那么你需要修改Jarrod的正则表达式^.*\\['(.*)'\\].*$以匹配每行多次，并且非贪婪。 （使用.*?量词而不是.*量词。）

In [15]: mystring = "[Bacon], [eggs], and [spam]."

In [16]: re.findall(r"\[(.*?)\]",mystring)
Out[16]: ['Bacon', 'eggs', 'spam']

正则表达式返回两个特殊字符之间的所有字符

问题描述

3 个解决方案

解决方案1
31 2012-03-27 14:41:12

正则表达式

履行

替代

解决方案2
20 已采纳

解决方案3
10 2012-03-27 12:56:38

正则表达式返回两个特殊字符之间的所有字符

问题描述

3 个解决方案

解决方案1 31 2012-03-27 14:41:12

正则表达式

履行

替代

解决方案2 20 已采纳

解决方案3 10 2012-03-27 12:56:38

解决方案1
31 2012-03-27 14:41:12

解决方案2
20 已采纳

解决方案3
10 2012-03-27 12:56:38