Python 正則表達式重新編譯查詢

Question

我正在嘗試使用正則表達式查詢從名稱列表中找到所需名稱的列表。

csv 文件：僅供參考，我將國家/地區從大寫字母轉換為小寫字母

搜索列表：

['AU.LS1_james.aus',
'AU.LS1_scott.aus',
'AP.LS1_amanda.usa',
'AP.LS1_john.usa',
'LA.LS1_harsha.ind',
'LA.LS1_vardhan.ind',
'IECAU13_peter-tu.can',
'LONSA13_smith.gbp']

搜索列表的searchList ： [(region)(Category)]_[EmployeeName].[country]
(region)(Category)連接在一起。

我正在嘗試獲取每個組的列表，

[
['AU.LS1_james.aus', 'AU.LS1_scott.aus'],
['AP.LS1_amanda.usa', 'AP.LS1_john.usa'],
['LA.LS1_harsha.ind', 'LA.LS1_vardhan.ind']
]

使用以下正則表達式查詢： \<({region}).*\{country}\>

for region, country in regionCountry:
    query = f"\<({region}).*\{country}\>"
    r = re.compile(query)
    group = list(filter(r.match, searchList))

我也嘗試過re.search ，但該group始終為None

僅供參考：我還在記事本++中使用正則表達式功能嘗試了這個查詢。

誰能告訴我腳本哪里出了問題。？ 謝謝

Answer 1

沒有正則表達式：

split
以及用於對條目進行分組的字典：

數據

entries = ['AU.LS1_james.aus', 'AU.LS1_scott.aus', 'AP.LS1_amanda.usa', 'AP.LS1_john.usa', 'LA.LS1_harsha.ind', 'LA.LS1_vardhan.ind']

解決方案 1 ：簡單的dict和setdefault

d = {}
for entry in entries:
    d.setdefault(entry.split('.',1)[0], []).append(entry)

解決方案2 ： defaultdict

from collections import defaultdict
d = defaultdict(list)
for entry in entries:
    d[entry.split('.',1)[0]].append(entry)

結果在d.values()

>>> list(d.values())

[['AU.LS1_james.aus', 'AU.LS1_scott.aus'],
 ['AP.LS1_amanda.usa', 'AP.LS1_john.usa'],
 ['LA.LS1_harsha.ind', 'LA.LS1_vardhan.ind']]

Answer 2

我感謝大家試圖協助我的問題。 這個答案很適合我的使用。 出於某種原因 python 不喜歡\<和\> 。 所以我只是刪除了它們並且效果很好。 沒想到使用re庫會有一些限制。

答案： f({region}).*\{country}

Python 正則表達式重新編譯查詢

問題描述

2 個解決方案

解決方案1
0 2022-02-06 15:08:41

解決方案2
-1 2022-02-07 20:42:43

Python 正則表達式重新編譯查詢

問題描述

2 個解決方案

解決方案1 0 2022-02-06 15:08:41

解決方案2 -1 2022-02-07 20:42:43

解決方案1
0 2022-02-06 15:08:41

解決方案2
-1 2022-02-07 20:42:43