查找所有出現的正則表達式模式，但忽略包含另一個模式的出現

Question

我有一段文本要解析：

「<%sM_item2><%sM_plusnum2>の|　<%sM_slot>の部分を|　<%sM_change_color>に　カラーリングするのですね？|<br>|「それでは　<%sM_item>が　１０本と|　<%nM_gold>ゴールドが必要ですが　よろしいですか？|<yesno><close>

在這個文本塊中，我試圖對所有出現的<???>進行正則表達式拆分，除了當它在<%???>上匹配時。

我主要使用它：

re.split(r'<((?!%).+?)>', source_text)

['「<%sM_item2><%sM_plusnum2>の|\u3000<%sM_slot>の部分を|\u3000<%sM_change_color>に\u3000カラーリングするのですね？|', 'br', '|「それでは\u3000<%sM_item>が\u3000１０
本と|\u3000<%nM_gold>ゴールドが必要ですが\u3000よろしいですか？|', 'yesno', '', 'close', '']

我的問題是雖然它保留了<%???>標簽，但它以某種方式從匹配中剝離了<>字符（注意“yesno”、“close”和“br”標簽不再有這些字符）。

Answer 1

基於re.split的文檔：

Split string by the occurrences of pattern. If capturing parentheses are used 
in pattern, then the text of all groups in the pattern are also returned as 
part of the resulting list.

在這種情況下，我的括號需要放在匹配的外部以保留() 。

re.split('(<(?!%).+?>)', source_text)
['「<%sM_item2><%sM_plusnum2>の|\u3000<%sM_slot>の部分を|\u3000<%sM_change_color>に\u3000カラーリングするのですね？|', '<br>', '|「それでは\u3000<%sM_item>が\u3000１０本と|\u3000<%nM_gold>ゴールドが必要ですが\u3000よろしいですか？|', '<yesno>', '', '<close>', '']

查找所有出現的正則表達式模式，但忽略包含另一個模式的出現

問題描述

1 個解決方案

解決方案1
0 2021-11-22 03:42:25

查找所有出現的正則表達式模式，但忽略包含另一個模式的出現

問題描述

1 個解決方案

解決方案1 0 2021-11-22 03:42:25

解決方案1
0 2021-11-22 03:42:25