繁体   English   中英

正则表达式匹配括号括起来并用竖线分隔的所有单词

[英]Regex match all words enclosed by parentheses and separated by a pipe

我认为图像有时比文字更好。

在此处输入图片说明

正如你所看到的,我的问题是它只匹配两个单词。 如何匹配所有单词?

我当前的正则表达式 (PCRE) : ([^\\|\\(\\)\\|]+)\\|([^\\|\\(\\)\\|]+)

目标:为每个单词检索单独分组中的所有单词

您可以在 C# 中使用无限长的后视(带有前瞻):

(?<=\([^()]*)\w+(?=[^()]*\))

请参阅正则表达式演示 详情

  • (?<=\\([^()]*) - 一个正向后视匹配紧跟在(和除()之外的零个或多个字符的位置
  • \\w+ - 一个或多个单词字符
  • (?=[^()]*\\)) - 匹配一个位置的正向前瞻,该位置紧随其后是零个或多个字符,而不是() ,然后是)字符。

捕获这些词的另一种方法是使用

(?:\G(?!^)\||\()(\w+)(?=[^()]*\))

请参阅此正则表达式演示 您需要的单词现在在第 1 组中。详细信息

  • (?:\\G(?!^)\\||\\() - 前一个匹配之后的位置 ( \\G(?!^) ) 和| char ( \\| ),或 ( | ) a ( char ( \\( )
  • (\\w+) - 第 1 组:一个或多个单词字符
  • (?=[^()]*\\)) - 正向预测,确保在当前位置右侧的除()之外的任何零个或多个字符之后有一个)字符。

可以使用 C# 提取匹配项

var matches = Regex.Matches(text, @"(?<=\([^()]*)\w+(?=[^()]*\))")
    .Cast<Match>()
    .Select(x => x.Value);

// Or
var matches = Regex.Matches(text, @"(?:\G(?!^)\||\()(\w+)(?=[^()]*\))")
    .Cast<Match>()
    .Select(x => x.Groups[1].Value);

在 c# 中,您还可以使用捕获组来使用组捕获。

匹配项在命名组word

\((?<word>\w+)(?:\|(?<word>\w+))*\)
  • \\(匹配(
  • (?<word>\\w+)匹配组word 1+ 个单词字符
  • (?:非捕获组
    • \\| 匹配|
    • (?<word>\\w+)匹配 1+ 个单词字符
  • )*关闭非捕获组并可选择重复以获取所有出现次数
  • \\)匹配右括号

正则表达式演示

在此处输入图片说明

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM