如何在python中編寫正則表達式來匹配這個？

Question

代碼如下：

#coding=utf-8

import re

str = "The output is\n"
str += "1) python\n"
str += "A dynamic language\n"
str += "easy to learn\n"
str += "2) C++\n"
str += "difficult to learn\n"
str += "3244) PHP\n"
str += "eay to learn\n"


pattern = r'^[1-9]+\) .*'
print re.findall(pattern,str,re.M)

輸出是

['1) python', '2) C++', '3244) PHP']

但是，我想將它拆分為：

['1) python\n'A dynamic language\n easy to learn\n'  2) C++\n difficult to learn\n', '3244) PHP\n easy to learn\n']

也就是說，忽略第一行不以“數字”開頭，並且當遇到一個數字時，以下行直到下一行以“數字”開頭“被認為是同一組。 我該如何重寫模式？

Answer 1

>>> import re
>>> strs = 'The output is\n1) python\nA dynamic language\neasy to learn\n2) C++\ndifficult to learn\n3244) PHP\neay to learn\n'
>>> re.findall(r'\d+\)\s[^\d]+',strs)
['1) python\nA dynamic language\neasy to learn\n',
'2) C++\ndifficult to learn\n',
'3244) PHP\neay to learn\n']

Answer 2

你可以使用這個，允許數字，但后面沒有右括號：

re.findall(r'\d+\)\s(?:\D+|\d+(?!\d*\)))*',str)

Answer 3

您需要將空白的python正則表達式添加到模式中以考慮換行符。

試試這個：

regex = r"[1-9]+\) .*\s.*"

\\ s是任何空格的正則表達式

如何在python中編寫正則表達式來匹配這個？

問題描述

3 個解決方案

解決方案1
3 已采納 2013-06-19 14:35:50

解決方案2
2 2013-06-19 14:39:01

解決方案3
1 2013-06-19 14:35:39

如何在python中編寫正則表達式來匹配這個？

問題描述

3 個解決方案

解決方案1 3 已采納 2013-06-19 14:35:50

解決方案2 2 2013-06-19 14:39:01

解決方案3 1 2013-06-19 14:35:39

解決方案1
3 已采納 2013-06-19 14:35:50

解決方案2
2 2013-06-19 14:39:01

解決方案3
1 2013-06-19 14:35:39