在Python中使用正則表達式獲取字符之前/之后的單詞

Question

使用捕獲組應該很容易，但我沒有得到正確的詞。 我一直在使用以下內容：

#Before
print(re.sub(r'\b([A-Za-z0-9]+)\b(?=\.?\s*(\&|\-|and))',r'\1','A. & B.',flags=re.IGNORECASE))
A. & B.

#After
print(re.sub(r'(\&|\-|and)\s*\b([A-Za-z0-9]+)\b',r'\2','A. & B.',flags=re.IGNORECASE))
A. B.

字符串可以是以下之一：

A. - B.
A.-B.
A. & B.
A.&B.
A. AND B.

為什么前面例子中的捕獲組沒有打印A和B ？

提前致謝：）

Answer 1

對於十進制值 1 或 0x01 十六進制，字符串'\\1'是八進制的。

>>> import re
>>> re.sub(r'\b([A-Za-z0-9]+)\b(?=\.?\s*(\&|\-|and))','\1','A. & B.',re.IGNORECASE)
'\x01. & B.'

正則表達式需要轉義反向引用。

這些替換字符串中的任何一個都指的是捕獲組 1
'\\\\r'

>>> import re
>>> re.sub(r'\b([A-Za-z0-9]+)\b(?=\.?\s*(\&|\-|and))','\\1','A. & B.',re.IGNORECASE)
'A. & B.'

或者，

r'\\1'

>>> import re
>>> re.sub(r'\b([A-Za-z0-9]+)\b(?=\.?\s*(\&|\-|and))',r'\1','A. & B.',re.IGNORECASE)
'A. & B.'

Answer 2

改用re.search()並在選項&,-,and之前和之后對所需的單詞進行分組：

text = re.search('(\w+)\.+\s*[\&*\-*AND*and*]*\s*(\w+)\.+', 'A. & B.')
print (text.groups())

在Python中使用正則表達式獲取字符之前/之后的單詞

問題描述

2 個解決方案

解決方案1
1

解決方案2
0 2019-12-11 00:38:11

在Python中使用正則表達式獲取字符之前/之后的單詞

問題描述

2 個解決方案

解決方案1 1

解決方案2 0 2019-12-11 00:38:11

解決方案1
1

解決方案2
0 2019-12-11 00:38:11