正则表达式：保持同一模式在同一行中多次发现，并通过在前面附加单个模式来替换行

Question

是否可以使用notepad ++（或从linux bash shell中）从找到的模式创建多行，与找到该模式的次数相同，并在新创建的行中追加单个找到的模式？

多重模式为val=[0-9]+单一模式为id=[a-zA-Z0-9]+

例：

输入线：

id=af2477,val=333,val=777
id=af3456,val=222,val=444,val=678
id=af3327,val=3234,val=123,val=701

输出线：

id=af2477,val=333
id=af2477,val=777
id=af3456,val=222
id=af3456,val=444
id=af3456,val=678
id=af3327,val=3234
id=af3327,val=123
id=af3327,val=701

我尝试了2个子组，但无法正常工作。 它将仅替换第二组：

查找内容： (id=[a-zA-Z0-9]+,)(val=[0-9]+,)*替换： \\n\\1,\\2

更新： Toto和Wiktor Stribiżew答案似乎都可以胜任。 尚未测试过。 我仍然想看看如何使用Notepad ++进行工作（即使需要多个步骤）

Answer 1

由于您还考虑为此使用Linux工具，因此awk解决方案看起来更可行：

awk 'BEGIN{FS=OFS=","} /^id=[a-zA-Z0-9]+(,val=[0-9]+)*$/{
    for(i=2; i<=NF; i++) {
        print $1,$i
    }; next;
}{print $0}' file > outfile

请参阅在线演示。

在这里，任何与^id=[a-zA-Z0-9]+(,val=[0-9]+)*$匹配的行（即与您需要扩展的行的格式匹配）都按照您的方式拆分需要with for(i=2; i<=NF; i++) {print $1,$i}; next; for(i=2; i<=NF; i++) {print $1,$i}; next; 。 否则，该行按原样写入（ print $0 ）。

BEGIN{FS=OFS=","}部分将输入和输出字段分隔符设置为逗号。

Answer 2

这个perl单线工作（在STDOUT上输出）：

perl -anE '($id,$vals)=/(id=\w+),(.+)$/;say "$id,$_" for split/,/,$vals' file
id=af2477,val=333
id=af2477,val=777
id=af3456,val=222
id=af3456,val=444
id=af3456,val=678
id=af3327,val=3234
id=af3327,val=123
id=af3327,val=701

说明：

($id,$vals)=/(id=\w+),(.+)$/;       # explode id and values for each line in input file
say "$id,$_" for split/,/,$vals     # print id and each value

您可以将输出重定向到另一个文件：

perl -anE '($id,$vals)=/(id=\w+),(.+)$/;say "$id,$_" for split/,/,$vals' file > outputfile

或就地进行更改：

perl -i -anE '($id,$vals)=/(id=\w+),(.+)$/;say "$id,$_" for split/,/,$vals' file

Answer 3

使用一个正则表达式来执行此操作是可能的，但非常复杂，您将不得不使用(?R)和条件语句。

通过多个步骤将非常简单。 例如，您可以使用最长的val中的最大val数来查找和替换，例如，假设4是val的最大数，那么我们将有四个(,val=[^\\r\\n,]*)在我们的初始表达式中：

^(id=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)$

并用四行替换

$1$2\n$1$3\n$1$4\n$1$5
 ---- ---- ---- ----

第一步演示

对于任何其他步骤，我们只需从初始表达式和替换的末尾删除一个val和一行。 例如，我们的表达式看起来像

^(id=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)$

在第二步中，我们将其替换为：

$1$2\n$1$3\n$1$4
----  ----  ----

第2步演示

在第三步（也是最后一步）中，我们的表达式具有两个值，

^(id=[^\r\n,]*)(,val=[^\r\n,]*)(,val=[^\r\n,]*)$

我们的替代品将有两行：

$1$2\n$1$3
----  ----

第3步演示

对于问题中示例的情况，仅需要两个步骤，第二个和第三个表达式可能就可以正常工作。

正则表达式：保持同一模式在同一行中多次发现，并通过在前面附加单个模式来替换行

问题描述

3 个解决方案

解决方案1
1 2019-09-01 09:56:58

解决方案2
1 2019-09-01 10:05:49

解决方案3
0 2019-09-01 21:12:11

第一步演示

第2步演示

第3步演示

正则表达式：保持同一模式在同一行中多次发现，并通过在前面附加单个模式来替换行

问题描述

3 个解决方案

解决方案1 1 2019-09-01 09:56:58

解决方案2 1 2019-09-01 10:05:49

解决方案3 0 2019-09-01 21:12:11

第一步演示

第2步演示

第3步演示

解决方案1
1 2019-09-01 09:56:58

解决方案2
1 2019-09-01 10:05:49

解决方案3
0 2019-09-01 21:12:11