多个重叠的正则表达式匹配而不是一个

Question

考虑这个字符串：

data <- "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3-1-I1-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3-1-QU-1-I2-1-I3-1-QU-1-NR-1-I2-1-I1-1-NR-1-QU-1-QU-1-I2-1-I1-1-EX"

这个正则表达式：

"(I3).{1,}(I3)"

这将匹配第一个I3和最后一个I3之间的部分。 但是，我应该如何修改正则表达式以匹配从I3开始和结束的每个单独部分？ 例如

I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3
I3-1-I1-1-FA-1-FA-1-NR-1-I3
I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3
I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3
I3-1-QU-1-I2-1-I3

Answer 1

使用非贪婪的形式和积极的前瞻。

"(?=(I3.+?I3))"

从组索引1中获取所需的字符串。Lookaheads有助于进行重叠匹配。 在R您必须启用perl=TRUE参数。

DEMO

Answer 2

您可以像这样使用带有gsub的strsplit ：

data <- "1-FA-1-I2-1-I2-1-I2-1-EX-1-I2-1-I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3-1-I1-1-FA-1-FA-1-NR-1-I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3-1-QU-1-I2-1-I3-1-QU-1-NR-1-I2-1-I1-1-NR-1-QU-1-QU-1-I2-1-I1-1-EX"
data <- gsub(".*?(I3.*?)(?=I3)","\\1I3§",data,perl=T)
strsplit(gsub("[^§]*$", "", data),"§")

.*?(I3.*?)(?=I3)正则表达式（用\\\\1I3§替换）将删除I3...I3之前的所有文本I3...I3 ，添加假符号§ （您可以使用任何不使用的），为我们添加一个备份I3 ，在输出中包含完整的I3封闭条目，然后第二个gsub将从字符串中删除尾随不必要的部分。 strsplit将做最后的部分 - 获取您的预期结果。

请参阅IDEONE演示

输出：

[1] "I3-1-FA-1-I1-1-I2-1-TR-1-I1-1-I2-1-FA-1-I3"                                   
[2] "I3-1-I1-1-FA-1-FA-1-NR-1-I3"                                                  
[3] "I3-1-I2-1-TR-1-I1-1-I2-1-I1-1-I2-1-FA-1-I2-1-I1-1-I3"                         
[4] "I3-1-FA-1-QU-1-I1-1-I2-1-I2-1-I2-1-NR-1-I2-1-I2-1-NR-1-I1-1-I2-1-I1-1-NR-1-I3"
[5] "I3-1-QU-1-I2-1-I3"

多个重叠的正则表达式匹配而不是一个

问题描述

2 个解决方案

解决方案1
3 2015-06-30 12:23:04

解决方案2
0 2015-06-30 12:24:52

多个重叠的正则表达式匹配而不是一个

问题描述

2 个解决方案

解决方案1 3 2015-06-30 12:23:04

解决方案2 0 2015-06-30 12:24:52

解决方案1
3 2015-06-30 12:23:04

解决方案2
0 2015-06-30 12:24:52