[英]JavaScript RegExp help for BBCode
我有几个星期前发现的这个RegExp表达式
/([\r\n])|(?:\[([a-z\*]{1,16})(?:=([^\x00-\x1F"'\(\)<>\[\]]{1,256}))?\])|(?:\[\/([a-z]{1,16})\])/ig
它正在努力寻找BBCode标签,如[url]
和[code]
。
但是,如果我尝试[url="http://www.google.com"]
,则无法匹配。 我不是很擅长RegExp而且我无法弄清楚如何仍然有效,但="http://www.google.com"
是可选的。
对于[color="red"]
这也是失败的,但是这与url标签所具有的问题相同。
这部分: [^\\x00-\\x1F"'\\(\\)<>\\[\\]]
表示在=
之后一定不能有”。 这意味着你的正则表达式匹配[url=http://stackoverflow.com]
。 如果你想有引号,你可以简单地将它们放在捕获组周围:
/([\r\n])|(?:\[([a-z\*]{1,16})(?:="([^\x00-\x1F"'\(\)<>\[\]]{1,256})")?\])|(?:\[\/([a-z]{1,16})\])/gi
我认为您可以从显式枚举您想要匹配的所有标记中受益,因为它应该允许更具体地匹配结束标记。
这是一个示例代码 :
var tags = [ 'url', 'code', 'b' ]; // add more tags
var regParts = tags.map(function (tag) {
return '(\\[' + tag + '(?:="[^"]*")?\\](?=.*?\\[\\/' + tag + '\\]))';
});
var re = new RegExp(regParts.join('|'), 'g');
您可能会注意到正则表达式由一组较小的表达式组成,每个较小的一个表示具有可变长度的可能属性的单个标记( (?:="[^"]*")?
,见下面的解释),如[url="google.com"]
,并用交替运算符|
分隔。
(="[^"]*")?
表示=
符号,然后是双引号,后跟任何数量的双引号( [^"]
以外的任何符号,即0或更多,( *
),后跟收尾报价。 决赛?
意味着整个群体可能根本不存在。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.