Python 正則表達式未正確捕獲組

Question

我有以下正則表達式(?:RE:\w+|Reference:)\s*((Mr|Mrs|Ms|Miss)?\s+([\w-]+)\s(\w+)) 。

輸入文本示例：

RE:11567 無名小姐 12345678
參考：張小姐 12345678
RE:J123 無名小姐 12345678
RE:J123 Miss Jane Doe 12345678 參考：測試公司

示例代碼：

import re

pattern = re.compile('(?:RE:\w+|Reference:)\s*((Mr|Mrs|Ms|Miss)?\s+([\w-]+)\s(\w+))')
result = pattern.findall('RE:11693 Miss Jane Doe 12345678')

對於所有 4 個，我期望輸出('Miss Jane Doe', 'Miss', 'Jane', 'Doe') 。 但是在第 4 個文本示例中，我得到[('Miss Jane Doe', 'Miss', 'Jane', 'Doe'), (' Test Company', '', 'Test', 'Company')]

我怎樣才能得到正確的輸出

Answer 1

只需將^添加到正則表達式的開頭即可僅在開頭匹配。 這使得它成為^(?:RE:\w+|Reference:)\s*((Mr|Mrs|Ms|Miss)?\s+([\w-]+)\s(\w+)) 。

Python 正則表達式未正確捕獲組

問題描述

1 個解決方案

解決方案1
1 已采納 2022-12-21 03:36:48

Python 正則表達式未正確捕獲組

問題描述

1 個解決方案

解決方案1 1 已采納 2022-12-21 03:36:48

解決方案1
1 已采納 2022-12-21 03:36:48