正则表达式匹配，如果不是之前和之后

Question

如果不是'金银花'的一部分，我怎么能匹配'吮吸'？

使用lookbehind和lookahead我可以匹配suck如果不是'honeysuck'或'suckle'，但它也不能捕捉像'honeysucker'的东西; 这里表达式应该匹配，因为它不以le结尾：

re.search(r'(?<!honey)suck(?!le)', 'honeysucker')

Answer 1

您需要嵌套环绕声断言：

>>> import re
>>> regex = re.compile(r"(?<!honey(?=suckle))suck")
>>> regex.search("honeysuckle")
>>> regex.search("honeysucker")
<_sre.SRE_Match object at 0x00000000029B6370>
>>> regex.search("suckle")
<_sre.SRE_Match object at 0x00000000029B63D8>
>>> regex.search("suck")
<_sre.SRE_Match object at 0x00000000029B6370>

一个等价的解决方案是suck(?!(?<=honeysuck)le) 。

Answer 2

这是一个不使用正则表达式的解决方案：

s = s.replace('honeysuckle','')

现在：

re.search('suck',s)

这适用于任何这些字符串： honeysuckle sucks ， this sucks ，甚至regular expressions suck this sucks 。

Answer 3

我相信你应该在不同的数组中分离你的异常，以防将来你希望添加不同的规则。 这将更容易阅读，并且如果需要将来更快。

我在Ruby中的建议是：

words = ['honeysuck', 'suckle', 'HONEYSUCKER', 'honeysuckle']

EXCEPTIONS = ['honeysuckle']

def match_suck word
  if (word =~ /suck/i) != nil
    # should not match any of the exceptions
    return true unless EXCEPTIONS.include? word.downcase
  end
  false
end

words.each{ |w|
  puts "Testing match of '#{w}' : #{match_suck(w)}"
}

Answer 4

>>>string = 'honeysucker'
>>>print 'suck' in string
True

正则表达式匹配，如果不是之前和之后

问题描述

4 个解决方案

解决方案1
4 已采纳 2014-02-17 10:13:27

解决方案2
2 2014-02-17 09:48:08

解决方案3
1 2014-02-17 10:16:05

解决方案4
0 2014-02-17 09:34:01

正则表达式匹配，如果不是之前和之后

问题描述

4 个解决方案

解决方案1 4 已采纳 2014-02-17 10:13:27

解决方案2 2 2014-02-17 09:48:08

解决方案3 1 2014-02-17 10:16:05

解决方案4 0 2014-02-17 09:34:01

解决方案1
4 已采纳 2014-02-17 10:13:27

解决方案2
2 2014-02-17 09:48:08

解决方案3
1 2014-02-17 10:16:05

解决方案4
0 2014-02-17 09:34:01