正则表达式选择不包含某些字符的文本

Question

我有这样的文字

MyText.xyz;
MyText.abc + "ss";

我想捕获MyText.之后的文本MyText. ，但不以结尾; 或空白区域，即我希望输出如下：

MyText.xyz
MyText.abc

我创建了此正则表达式： MyText.(.*(?=\\;)) ，以实现我的目标。

但是，现在正则表达式匹配的文本是MyText.xyz和MyText.abc + "ss" ，即第二个结果不正确。

Answer 1

您可以使用否定的字符类来修复它：

MyText\.[^\s;]+
        ^^^^^^^

见正则表达式演示

正则表达式详细信息

MyText\\. -文字MyText. 子（注意.一定要逃到一个字面匹配. CHAR）
[^\\s;]+ -否定的字符类，与除空格（ \\s ）和;之外的任何1+个字符匹配; 烧焦

用作var pattern = @"MyText\\.[^\\s;]+"; 在C＃中。

Answer 2

MyText\..+?\b(?<!;)
   ^  ^ ^  ^  ^
   |__|_|__|__|______ MyText : "MyText" literal
      |_|__|__|______ \.     : "." literal, escaped by "\"
        |__|__|______ .      : any character
           |__|______ ?\b    : non-greedy search up to boundary (\b)
              |______ (?<!;) : not ended by ';'

测试：

$ cat sample.txt
MyText.xyz;
MyText.abc + "ss";
MyText.uuu+"yyy";

$ grep -Po 'MyText\..+?\b(?<!;)' <sample.txt
MyText.xyz
MyText.abc
MyText.uuu

注意：它基于@WiktorStribiżew的解决方案，并增加了后面的功能

Answer 3

您正在使用

MyText.(.*(?=\;))

第一个错误是. 在MyText之后，应该是\\. 如果要匹配文字点。

后半部分也不正确，您尝试匹配任意数量的非换行符，后跟一个; ，这就是您获得结果的原因。

尝试使用此正则表达式：

MyText.[^ ;]*

[^ ;]*匹配非空格或;任何字符; 。 如果您也不希望制表符或换行符匹配，则可以改用以下内容：

MyText.[^\s;]*

\\s匹配任何空格字符。

正则表达式选择不包含某些字符的文本

问题描述

3 个解决方案

解决方案1
1 2018-01-24 11:04:23

解决方案2
1 2018-01-24 14:24:22

解决方案3
0 2018-01-24 14:37:40

正则表达式选择不包含某些字符的文本

问题描述

3 个解决方案

解决方案1 1 2018-01-24 11:04:23

解决方案2 1 2018-01-24 14:24:22

解决方案3 0 2018-01-24 14:37:40

解决方案1
1 2018-01-24 11:04:23

解决方案2
1 2018-01-24 14:24:22

解决方案3
0 2018-01-24 14:37:40