繁体   English   中英

在 .NET 中使用正则表达式拆分字符串

[英]Splitting a string with regular expressions in .NET

当我在 .NET 中执行 RegEx.Split() 时,我需要一个正则表达式来检查字符串并返回特定项目。 我一直在尝试自己做这件事,但我似乎永远无法得到我需要的东西,结果也没有任何意义。 显然我没有很好地处理编写正则表达式。

所以这里是字符串...

"%date - %-5level - [%thread] - %logger - %message - %exception%newline"

我本质上想要返回一个如下所示的数组:

"date"
"-5level"
"thread"
"logger"
"message"
"exception"
"newline"

以下代码很接近,但并不完全。

Regex exp = new Regex(@"\W+");
string[] s = exp.Split(@"%date - %-5level - [%thread] - %logger - %message - %exception%newline");

我得到以下信息:

""
"date"
"5level"
"thread"
"logger"
"message"
"exception"
"newline"

出于某种原因,我有一个空字符串作为第一个索引,而第三个索引缺少“-”。 我假设是因为它不是“单词”的一部分。

暂时将“-”放在一边,然后我想将“5level”拆分为一个数组:

"5"
"level"

我对此进行了实验:

Regex exp2 = new Regex(@"(\d+)([a-zA-Z]+)");
string[] s2 = exp2.Split("5level");

但是,除了我想要的拆分项之外,它还返回 2 个带有空字符串的索引:

""
"5"
"level"
""

我对如何格式化表达式以提供我需要的东西感到困惑。 任何帮助,将不胜感激。

而不是使用Regex.Split ,匹配您需要的标记可能更容易:

MatchCollection matches = Regex.Matches(s, @"%([\w\-]+)");
string[] words = matches.Cast<Match>().Select(m => m.Groups[1].Value).ToArray();

正如您所见,Split 可能会添加空匹配项,这些匹配项必须被过滤掉。

更好的方法是使用RegEx引擎中的Named Capturing Groups并过滤掉Linq查询中的任何空匹配项。

MatchCollection matches = Regex.Matches(s, @"%(?<SomeName>[\w\-]+)");
string[] words = matches.Cast<Match>().Where(m => m.Length > 0 ).Select(m => m.Groups["SomeName"].Value).ToArray();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM