python正则表达式分组

Question

我的正则表达式目标：

“如果句子中包含'＃'，则将所有内容分组到'＃'的左侧，并将所有内容分组在'＃'的右侧。如果字符没有'＃'，然后将整个句子归为一组”

两种情况的示例：

A) '120x4#Words' -> ('120x4', 'Words')
B) '120x4@9.5' -> ('120x4@9.5')

我做了一个可以正确解析情况A的正则表达式

(.*)(?:#(.*))

# List the groups found
>>> r.groups()
(u'120x4', u'words')

但是，这当然不适用于情况B-我需要将“＃及其右边的所有内容”设置为可选

因此我尝试使用“？” 第二个分组上的“零或无”运算符表示它是可选的。
(.*)(?:#(.*))?

但这给我不好的结果。 第一组吃掉了整个串。

# List the groups found
>>> r.groups()
(u'120x4#words', None)

猜猜我是不是误解了一个或一个'？' 运算符及其在分组上的工作方式，或者我误解了第一组如何表现贪婪并抓取整个字符串。 我确实尝试过让第一组“不愿”，但这给了我一个完全不匹配的机会。

(.*?)(?:#(.*))?


# List the groups found
>>> r.groups()
(u'', None)

Answer 1

只需使用标准的str.split函数：

s = '120x4#Words'
x = s.split( '#' )

如果仍然需要正则表达式解决方案，请使用以下模式：

([^#]+)(?:#(.*))?

Answer 2

使用re.split ：

>>> import re
>>> a='120x4#Words'
>>> re.split('#',a)
['120x4', 'Words']
>>> b='120x4@9.5'
>>> re.split('#',b)
['120x4@9.5']
>>>

Answer 3

(.*?)#(.*)|(.+)

这应该工作。请参阅演示。

http://regex101.com/r/oC3nN4/14

Answer 4

这里有一个详细的re解。 但是，最好使用str.split 。

import re

REGEX = re.compile(r'''
    \A
    (?P<left>.*?)
    (?:
        [#]
        (?P<right>.*)
    )?
    \Z
''', re.VERBOSE)


def parse(text):
    match = REGEX.match(text)
    if match:
        return tuple(filter(None, match.groups()))

print(parse('120x4#Words'))
print(parse('120x4@9.5'))

更好的解决方案

def parse(text):
    return text.split('#', maxsplit=1)

print(parse('120x4#Words'))
print(parse('120x4@9.5'))

python正则表达式分组

问题描述

4 个解决方案

解决方案1
3 2014-09-07 14:32:02

解决方案2
1 2014-09-07 14:29:54

解决方案3
1 已采纳 2014-09-07 14:30:04

解决方案4
1 2014-09-07 14:42:25

python正则表达式分组

问题描述

4 个解决方案

解决方案1 3 2014-09-07 14:32:02

解决方案2 1 2014-09-07 14:29:54

解决方案3 1 已采纳 2014-09-07 14:30:04

解决方案4 1 2014-09-07 14:42:25

解决方案1
3 2014-09-07 14:32:02

解决方案2
1 2014-09-07 14:29:54

解决方案3
1 已采纳 2014-09-07 14:30:04

解决方案4
1 2014-09-07 14:42:25