以有效的方式組合正則表達式 python

Question

設置

我動態創建一個正則表達式列表，即regex_list 。 列表中的每個正則表達式都肯定至少與應用的文本匹配。 列表中的某些正則表達式可能是相等的。

regex_list = []
for f in foo: # foo is a list of strings e.g. foo = ['foo1', 'foo2', 'foo1', ...]
    # f is a valid expression to be used inside the regex
    regex_list.append(f'[^.]*?{f}[^.]*\.')

regex = re.compile('|'.join(regex_list), flags=re.DOTALL)
result = re.findall(regex, text)

問題

自從

regex_list中的某些正則表達式可能等於
regex_list中的正則表達式與 OR 運算符組合在一起

對於列表中存在另一個副本的正則表達式，僅捕獲文本中的第一個匹配項。

問題

一種解決方法可能是使用 for 循環單獨應用每個正則表達式，但它非常慢。

有沒有一種結合正則表達式並使它們盡可能匹配的好方法？

Answer 1

偶然發現使用re 模塊在 for 循環中單獨應用每個 regex 非常慢，而使用regex 模塊卻出奇的快。

以有效的方式組合正則表達式 python

問題描述

設置

問題

問題

1 個解決方案

解決方案1
0 已采納 2021-04-22 12:34:08

以有效的方式組合正則表達式 python

問題描述

設置

問題

問題

1 個解決方案

解決方案1 0 已采納 2021-04-22 12:34:08

解決方案1
0 已采納 2021-04-22 12:34:08