用正则表达式匹配特定序列？

Question

我正在尝试匹配显示为：

abcd[_stringiwant_]efgh

和

abcd[_string_i_want_]efgh

我可以用以下方式表达第一个表达式：

re.compile('\[_[^\[\]_]*_\]');

但这无法获取第二个表达式的字符串。 有人对两者都适用的正则表达式有任何建议吗？

Answer 1

re.compile('\[([^\]]+)\]')

那应该行得通。 不确定您必须做的任何 Python 特定的事情，但是该表达式将获取 [ 和 ] 之间的任何字符串

Answer 2

大卫的正则表达式应该可以工作，但我更喜欢

re.compile(r'\[(.+?)\]')

为了可读性。 +? 是一个非贪婪的修饰符，这意味着它将抓取尽可能少的字符，即它将抓取所有字符，直到第一个] 。

Answer 3

我想我需要更多信息，但我会在黑暗中试一试，说当你真的想要 findall 时，你可能正在使用搜索。 此外，根据您的描述，您的正则表达式并不完全正确（为什么下划线？您是否希望它返回空字符串？如果不是，则不要使用 *，使用 +）。 尝试这个：

searcher = re.compile(r'\[([^\]]+)\]')
list_of_results = searcher.findall(string_to_search)

Answer 4

我想你想要的是：

text = '''zza [_stringiwant_] cododo
21321324654654654
aaaaaaaaaa [stringiDONTwant_] bbb
cccc[stringiDONTwantnomore]ddddd
hghghg [_string_i_want_] lumulu
321321
rrree  [_out of need] kjhfkhfg'''

import re

regx = re.compile('(?<=\[_).+?(?=_\])')

print regx.findall(text)

结果

['stringiwant', 'string_i_want']

用正则表达式匹配特定序列？

问题描述

4 个解决方案

解决方案1
2 2011-05-04 20:21:06

解决方案2
1 2011-05-04 20:28:33

解决方案3
0 2011-05-04 20:31:22

解决方案4
0 2011-05-05 00:58:27

用正则表达式匹配特定序列？

问题描述

4 个解决方案

解决方案1 2 2011-05-04 20:21:06

解决方案2 1 2011-05-04 20:28:33

解决方案3 0 2011-05-04 20:31:22

解决方案4 0 2011-05-05 00:58:27

解决方案1
2 2011-05-04 20:21:06

解决方案2
1 2011-05-04 20:28:33

解决方案3
0 2011-05-04 20:31:22

解决方案4
0 2011-05-05 00:58:27