REGEX模式可排除特定字符串

Question

我有一个具有以下格式的字符串：

some text <br>septembar 1989<br>

我正在使用此正则表达式查找月份和年份部分

<br/?>(?!=b\.)(.*?\b\d{4}\b)

我得到了我septembar 1989

但是，我现在有插入 情况

<br>some text <br>septembar 1989<br>

结果： some text septembar 1989

您能否建议如何修改现有模式以支持这两种情况？ 我想我需要以某种方式排除 与.*?匹配.*?

Answer 1

尝试这个

<br/?>([^<]+)\d{4}

[^<]表示匹配任何内容，除了所需的开始标签。

Answer 2

import re

ss = 'dfgqeg<br>some text <br>septembar 1989<br>'

reg = re.compile('<br(?: /)?>'
                 '(?!.+?<br(?: /)?>.+?<br(?: /)?>)'
                 '(.+?\d{4})'
                 '<br(?: /)?>')

print reg.search(ss).group(1)

。

'<br(?: /)?>'捕获 和 事件

。

'(?!.+?<br(?: /)?>.+?<br(?: /)?>)'是一个先行断言，
它验证在分析的文本中起始位置之后，是否没有描述为以下内容的字符集：
- .+? 任何字符，但? 命令，必须在遇到 或 立即停止此部分
-  或 
- 再次在 或 之前停止的任何字符
-  或

Answer 3

我写了一个简单的代码，可能对您有所帮助：

import re
def getDate(str):
 m = re.match("[\<br>]*[\w\s]*\<br>([\w\s]*[12][0-9]{3})",str);
 return m.group(1)

print getDate("some text <br>dec 1989<br>");
print getDate("<br> some text <br>septembar 1989<br>");
print getDate("grijesh chuahan <br>feb 2009<br>");

输出：

dec 1989
septembar 1989
feb 2009

REGEX模式可排除特定字符串

问题描述

3 个解决方案

解决方案1
0 2013-03-04 13:15:46

解决方案2
0 2013-03-04 13:24:29

解决方案3
0 2013-03-04 13:52:52

REGEX模式可排除特定字符串

问题描述

3 个解决方案

解决方案1 0 2013-03-04 13:15:46

解决方案2 0 2013-03-04 13:24:29

解决方案3 0 2013-03-04 13:52:52

解决方案1
0 2013-03-04 13:15:46

解决方案2
0 2013-03-04 13:24:29

解决方案3
0 2013-03-04 13:52:52