在正則表達式（python）中為一個字符串段獲取太多匹配項

Question

我正在嘗試編寫一個正則表達式腳本來查找文本中的所有金錢實例，並且我的代碼可以正常工作，但我無法弄清楚為什么它會在我的字符串中找到多個版本的東西。

例如，在這段代碼中：

string = "$50.00"
print "number dollars: "
print re.findall("\-?\(?\$?\s*\-?\s*\(?(((\d{1,3}((\,\d{3})*|\d*))?(\.\d{1,4})?)|((\d{1,3}((\,\d{3})*|\d*))(\.\d{0,4})?))\)?\ ?(one)?\ ?(two)?\ ?(three)?\ ?(four)?\ ?(five)?\ ?(six)?\ ?(seven)?\ ?(eight)?\ ?(nine)?\ ?(ten)?\ ?(eleven)?\ ?(twelve)?\ ?(thirteen)?\ ?(fourteen)?\ ?(fifteen)?\ ?(sixteen)?\ ?(seventeen)?\ ?(eighteen)?\ ?(nineteen)?\ ?(hundred)?\ ?(thousand)?\ ?(million)?\ ?(billion)?\ ?(trillion)?\ ?(dollars)?\ ?(pounds)?\ ?(euros)?", string)

這是我得到的結果：

number dollars: 
[('50.00', '50.00', '50', '', '', '.00', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', ''), ('', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '')]

這本身就是正則表達式：

\-?\(?\$?\s*\-?\s*\(?(((\d{1,3}((\,\d{3})*|\d*))?(\.\d{1,4})?)|((\d{1,3}((\,\d{3})*|\d*))(\.\d{0,4})?))\)?\ ?(one)?\ ?(two)?\ ?(three)?\ ?(four)?\ ?(five)?\ ?(six)?\ ?(seven)?\ ?(eight)?\ ?(nine)?\ ?(ten)?\ ?(eleven)?\ ?(twelve)?\ ?(thirteen)?\ ?(fourteen)?\ ?(fifteen)?\ ?(sixteen)?\ ?(seventeen)?\ ?(eighteen)?\ ?(nineteen)?\ ?(hundred)?\ ?(thousand)?\ ?(million)?\ ?(billion)?\ ?(trillion)?\ ?(dollars)?\ ?(pounds)?\ ?(euros)?

Answer 1

結果包含來自每個帶括號的 group的字符串，對應於每個組中的子表達式匹配的字符串部分，按照左括號的順序（例如(\d+(\.\d+)?)將給出['50.00', '.00'] ）。 為防止組的內容被捕獲，請在子表達式前加上?:前綴（例如(?:,\d{3})*|\d*) ）； 這將創建一個非捕獲組。

大多數組用於未出現在字符串中的單詞，這會在結果中產生大部分空字符串。

在正則表達式（python）中為一個字符串段獲取太多匹配項

問題描述

1 個解決方案

解決方案1
0

在正則表達式（python）中為一個字符串段獲取太多匹配項

問題描述

1 個解決方案

解決方案1 0

解決方案1
0