多個重疊的正則表達式匹配而不是一個

Question

考慮這個字符串：

data <- "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3-1-I1-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3-1-QU-1-I2-1-I3-1-QU-1-NR-1-I2-1-I1-1-NR-1-QU-1-QU-1-I2-1-I1-1-EX"

這個正則表達式：

"(I3).{1,}(I3)"

這將匹配第一個I3和最后一個I3之間的部分。 但是，我應該如何修改正則表達式以匹配從I3開始和結束的每個單獨部分？ 例如

I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3
I3-1-I1-1-FA-1-FA-1-NR-1-I3
I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3
I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3
I3-1-QU-1-I2-1-I3

Answer 1

使用非貪婪的形式和積極的前瞻。

"(?=(I3.+?I3))"

從組索引1中獲取所需的字符串。Lookaheads有助於進行重疊匹配。 在R您必須啟用perl=TRUE參數。

DEMO

Answer 2

您可以像這樣使用帶有gsub的strsplit ：

data <- "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3-1-I1-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3-1-QU-1-I2-1-I3-1-QU-1-NR-1-I2-1-I1-1-NR-1-QU-1-QU-1-I2-1-I1-1-EX"
data <- gsub(".*?(I3.*?)(?=I3)","\\1I3§",data,perl=T)
strsplit(gsub("[^§]*$", "", data),"§")

.*?(I3.*?)(?=I3)正則表達式（用\\\\1I3§替換）將刪除I3...I3之前的所有文本I3...I3 ，添加假符號§ （您可以使用任何不使用的），為我們添加一個備份I3 ，在輸出中包含完整的I3封閉條目，然后第二個gsub將從字符串中刪除尾隨不必要的部分。 strsplit將做最后的部分 - 獲取您的預期結果。

請參閱IDEONE演示

輸出：

[1] "I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3"                                   
[2] "I3-1-I1-1-FA-1-FA-1-NR-1-I3"                                                  
[3] "I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3"                         
[4] "I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3"
[5] "I3-1-QU-1-I2-1-I3"

多個重疊的正則表達式匹配而不是一個

問題描述

2 個解決方案

解決方案1
3 2015-06-30 12:23:04

解決方案2
0 2015-06-30 12:24:52

多個重疊的正則表達式匹配而不是一個

問題描述

2 個解決方案

解決方案1 3 2015-06-30 12:23:04

解決方案2 0 2015-06-30 12:24:52

解決方案1
3 2015-06-30 12:23:04

解決方案2
0 2015-06-30 12:24:52