繁体   English   中英

如何使用Regex.Split分割字符串并保留所有分隔符?

[英]How to split string with Regex.Split and keep all separators?

如何使用Regex.Split分割字符串并保留所有分隔符?

我有一个字符串:“ substring1 delimeter1 substring2”,其中delimeter + substring2是地址的一部分。

我也有2个或更多的分度符:delim1,delim2的含义是相等的;

我想要这样的字符串数组:

arr[0]="subsctring1";
arr[1]="delim1 subsctring2";

要么,

arr[1]="delim2 subsctring2;

我有一个模式:

addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);

但是,效果不佳。

您可以帮我建立一个有效的模式吗?

您只需要具有前瞻性的模式:

\s+(?=delim1|delim2)

\\s+将匹配1个或多个空格(因为您的字符串包含空格)。 如果没有空格,请使用\\s* (但是您将需要从结果中删除空条目)。 参见regex演示 如果这些定界符必须是整个单词,请使用\\b单词边界: \\s+(?=\\b(?:delim1|delim2)\\b)

在C#中:

addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));

如果定界符可以包含特殊的正则表达式元字符,则需要在delimiters列表上运行Regex.Escape

一个C#演示

var inputText = "substring1 delim1 substring2 delim2 substr3";
var  delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText, 
        string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));

我认为您需要先行使用,而不要先行使用(要想做到这一点,虽然还没有尝试过)。

另外,您必须注意分隔符。 必须对它们进行转义以使其作为正则表达式中的模式正常工作。

尝试这个:

addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM