繁体   English   中英

BBCode的JavaScript RegExp帮助

[英]JavaScript RegExp help for BBCode

我有几个星期前发现的这个RegExp表达式

/([\r\n])|(?:\[([a-z\*]{1,16})(?:=([^\x00-\x1F"'\(\)<>\[\]]{1,256}))?\])|(?:\[\/([a-z]{1,16})\])/ig

它正在努力寻找BBCode标签,如[url][code]

但是,如果我尝试[url="http://www.google.com"] ,则无法匹配。 我不是很擅长RegExp而且我无法弄清楚如何仍然有效,但="http://www.google.com"是可选的。

对于[color="red"]这也是失败的,但是这与url标签所具有的问题相同。

这部分: [^\\x00-\\x1F"'\\(\\)<>\\[\\]]表示在=之后一定不能有”。 这意味着你的正则表达式匹配[url=http://stackoverflow.com] 如果你想有引号,你可以简单地将它们放在捕获组周围:

/([\r\n])|(?:\[([a-z\*]{1,16})(?:="([^\x00-\x1F"'\(\)<>\[\]]{1,256})")?\])|(?:\[\/([a-z]{1,16})\])/gi

我认为您可以从显式枚举您想要匹配的所有标记中受益,因为它应该允许更具体地匹配结束标记。

这是一个示例代码

var tags = [ 'url', 'code', 'b' ]; // add more tags

var regParts = tags.map(function (tag) {
    return '(\\[' + tag + '(?:="[^"]*")?\\](?=.*?\\[\\/' + tag + '\\]))';
});

var re = new RegExp(regParts.join('|'), 'g');

您可能会注意到正则表达式由一组较小的表达式组成,每个较小的一个表示具有可变长度的可能属性的单个标记( (?:="[^"]*")? ,见下面的解释),如[url="google.com"] ,并用交替运算符|分隔。

(="[^"]*")?表示=符号,然后是双引号,后跟任何数量的双引号( [^"]以外的任何符号,即0或更多,( * ),后跟收尾报价。 决赛? 意味着整个群体可能根本不存在。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM