[英]How to split string with Regex.Split and keep all separators?
如何使用Regex.Split分割字符串並保留所有分隔符?
我有一個字符串:“ substring1 delimeter1 substring2”,其中delimeter + substring2是地址的一部分。
我也有2個或更多的分度符:delim1,delim2的含義是相等的;
我想要這樣的字符串數組:
arr[0]="subsctring1";
arr[1]="delim1 subsctring2";
要么,
arr[1]="delim2 subsctring2;
我有一個模式:
addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);
但是,效果不佳。
您可以幫我建立一個有效的模式嗎?
您只需要具有前瞻性的模式:
\s+(?=delim1|delim2)
\\s+
將匹配1個或多個空格(因為您的字符串包含空格)。 如果沒有空格,請使用\\s*
(但是您將需要從結果中刪除空條目)。 參見regex演示 。 如果這些定界符必須是整個單詞,請使用\\b
單詞邊界: \\s+(?=\\b(?:delim1|delim2)\\b)
。
在C#中:
addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));
如果定界符可以包含特殊的正則表達式元字符,則需要在delimiters
列表上運行Regex.Escape
。
一個C#演示 :
var inputText = "substring1 delim1 substring2 delim2 substr3";
var delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText,
string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));
我認為您需要先行使用,而不要先行使用(要想做到這一點,雖然還沒有嘗試過)。
另外,您必須注意分隔符。 必須對它們進行轉義以使其作為正則表達式中的模式正常工作。
嘗試這個:
addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.