繁体   English   中英

RegEx忽略字符串的一部分来提取文本

[英]RegEx ignoring part of string to extract out text

我有以下字符串:

@delimabc@delim@delim123@delim@delim456@delim

我需要编写一个.Net RegEx,在这个例子中找到3个匹配项(但假设匹配的数量是可变的:

  • ABC
  • 123
  • 456

如何编写一个RegEx,使表达式只匹配第一个和第二个@delim,然后匹配第三个和第四个,依此类推?

以下将从@delim字符串的第一个实例到最后一个实例进行捕获。

@delim(.+)+@delim

您可以使用后面的样子:

(?<=@delim)\w+

(?<=@delim)正在使用Positive Lookbehind ,它将字符匹配字符@delim (区分大小写)

\\w+将匹配[a-zA-Z0-9_]中的任何单词字符。 要包含或排除字符,您可以用[a-zA-Z0-9_]替换\\w ,并包含新字符或删除不应在表达式中评估的字符。

在线演示

这是.NET在线演示:

.NET在线演示

VB.NET版本

Dim sampleInput="@delimabc@delim@delim123@delim@delim456@delim"
Dim results = Regex.Matches(sampleInput,"(?<=@delim)\w+")

For Each item As Group In results
    Console.WriteLine("Line: {0}", item)
Next

C#版本

var sampleInput = "@delimabc@delim@delim123@delim@delim456@delim";
var results = Regex.Matches(sampleInput, "(?<=@delim)\\w+");

foreach (Group item in results) {
    Console.WriteLine("Line: {0}", item);
}

更新后的版本:

(?<=@delim)[^@].+?(?=@delim|$)
@delim(.+?)@delim

试试这个。设置g标志。刚修改你的正则表达式添加? 。抓住那些蠢货。看看演示。

http://regex101.com/r/uH3tP3/1

你可以在这个正则表达式上使用split:

(?:@delim)+

RegEx演示

或者用空字符串替换给定的正则表达式模式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM