為什么我的正則表達式不匹配？

Question

我有以下模式：

find_pattern = re.compile(r'(ga:country:\s)([a-zA-Z()\s]*)(.*users:\s)(\d+),')

這是應該匹配的輸入的樣子：

        ga:country: (not set),Date range:0,ga:users:60,
        ga:country: Albania,Date range:0,ga:users:7,
        ga:country: Algeria,Date range:0,ga:users:10,
        ...
        ga:country: Argentina,Date range:0,ga:users:61,
        ga:country: Armenia,Date range:0,ga:users:2,

這就是 output 的格式化方式（以防它為問題增加任何價值）：

        ['(not set)', 60],
        ['Albania', 7],

當我運行測試時：

matches = find_pattern.finditer(self.data)
print('matches:', matches)
for match in matches:
    print(match)

找不到匹配項。

希望有人能夠提供幫助。

Answer 1

我建議使用 2 個捕獲組而不是 4 個，在ga:之后添加可選的空白字符，並在users:

.*也可以是非貪婪的.*? 獲得第一個以防有更多users:零件。

為了防止users:開始一個更大的詞的一部分，你可以讓它更具體地匹配:users:

\bga:\s*country:\s*([a-zA-Z()\s]*),.*?:users:(\d+)

正則表達式演示

re.findall 的示例返回捕獲組的值：

import re

regex = r"\bga:\s*country:\s*([a-zA-Z()\s]*),.*?:users:(\d+)"

s = ("ga:country: (not set),Date range:0,ga:users:60,\n"
    "ga:country: Albania,Date range:0,ga:users:7,\n"
    "ga:country: Algeria,Date range:0,ga:users:10,\n"
    "ga:country: Argentina,Date range:0,ga:users:61,\n"
    "ga:country: Armenia,Date range:0,ga:users:2,")

print(re.findall(regex, s))

Output

[('(not set)', '60'), ('Albania', '7'), ('Algeria', '10'), ('Argentina', '61'), ('Armenia', '2')]

為什么我的正則表達式不匹配？

問題描述

1 個解決方案

解決方案1
0 2020-11-12 13:06:45

為什么我的正則表達式不匹配？

問題描述

1 個解決方案

解決方案1 0 2020-11-12 13:06:45

解決方案1
0 2020-11-12 13:06:45