![](/img/trans.png)
[英]Regex for matching string in parentheses including when opening or closing parenthesis is missing
[英]Missing parentheses with Regex
我是否正确认为Regex不能用于检测缺失的括号(因为没有办法计算对)? 使用JavaScript我有大约一千个被截断的字符串,需要手工编辑。 我希望能够将这个列表缩小到使用代码需要注意的列表。 字符串可以被认为是:
如果这是不可能的,那么我只需编写一个函数来寻找支架对。 谢谢
function isFine(str) {
return /[(){}\[\]]/.test( str ) &&
( str.match( /\(/g ) || '' ).length == ( str.match( /\)/g ) || '' ).length &&
( str.match( /\[/g ) || '' ).length == ( str.match( /]/g ) || '' ).length &&
( str.match( /{/g ) || '' ).length == ( str.match( /}/g ) || '' ).length;
}
测试
isFine('(this is fine and does not need attention)'); // true
isFine('This is also [fine]'); // true
isFine('This is bad( and needs to be edited'); // false
isFine('This [is (also) bad'); // false
isFine('as is this} bad'); // false
isFine('this string has no brackets but must also be considered'); // false
但请注意,这不会检查括号顺序,即a)b(c
将被视为罚款。
对于记录,这是一个检查缺少括号并检查每种类型是否正确平衡的函数。 它不允许a)b(c
,但它确实允许(a[bc)d]
因为每种类型都是单独检查的。
function checkBrackets( str ) {
var lb, rb, li, ri,
i = 0,
brkts = [ '(', ')', '{', '}', '[', ']' ];
while ( lb = brkts[ i++ ], rb = brkts[ i++ ] ) {
li = ri = 0;
while ( li = str.indexOf( lb, li ) + 1 ) {
if ( ( ri = str.indexOf( rb, ri ) + 1 ) < li ) {
return false;
}
}
if ( str.indexOf( rb, ri ) + 1 ) {
return false;
}
}
return true;
}
最后,进一步到Christophe的帖子,这里似乎是检查缺失括号并检查所有都是正确平衡和嵌套的最佳解决方案:
function checkBrackets( str ) {
var s;
str = str.replace( /[^{}[\]()]/g, '' );
while ( s != str ) {
s = str;
str = str.replace( /{}|\[]|\(\)/g, '' )
}
return !str;
};
checkBrackets( 'ab)cd(efg' ); // false
checkBrackets( '((a)[{{b}}]c)' ); // true
checkBrackets( 'ab[cd]efg' ); // true
checkBrackets( 'a(b[c)d]e' ); // false
你不能在正则表达式中进行递归,但是你总是可以在JavaScript中进行。
这是一个例子:
// First remove non-brackets:
string=string.replace(/[^{}[\]()]/g,"");
// Then remove bracket pairs recursively
while (string!==oldstring) {
oldstring=string;
string=string.replace(/({}|\[\]|\(\))/g,"");
}
其余部分是不匹配的括号。
现场演示: http : //jsfiddle.net/3Njzv/
如果您需要计算对数,可以一次更换一个并添加一个计数器:
// First remove non-brackets:
string=string.replace(/[^{}[\]()]/g,"");
// Then remove bracket pairs recursively
var counter=-1;
while (string!==oldstring) {
counter ++;
oldstring=string;
string=string.replace(/({}|\[\]|\(\))/,"");
}
可以使用递归正则表达式来验证匹配的括号。 例如,在Perl中,以下表达式匹配带有proper ()
{}
[]
嵌套的字符串:
$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/;
为清楚起见,这是相同的表达式:
$r = qr/
(?:
(?>
[^(){}\[\]]+
)
|
\(
(??{$r})
\)
|
\{
(??{$r})
\}
|
\[
(??{$r})
\]
)*
/x;
外部组用*
而不是+
来量化,以便匹配空字符串,因此为了使$r
有用,实际匹配必须使用一个使用lookaheads / lookbehinds或以其他方式建立上下文的表达式来完成,例如/^$r$/
。 例如,以下内容仅打印文件中没有正确嵌套的行:
perl -ne '$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/; print if !m/^$r$/' file
为了解释您的说明:如果这些是文件名而不是文件内容,您可以将ls
的输出或find
或其他内容输出到上面的命令sans file
:
ls | perl -ne '$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/; print if !m/^$r$/'
然而,正如其他人所说,非正则表达式解决方案通常可能更好。
注意来自Perl doc :“警告:这个扩展的正则表达式功能被认为是实验性的,并且可能会在没有通知的情况下进行更改。由于正则表达式引擎中未来优化的影响,执行的具有副作用的代码在版本之间可能无法完全相同“。
一些正则表达式风格能够匹配嵌套括号等递归结构,但语法非常复杂,编写函数通常更容易。 JavaScript正则表达式根本不支持递归。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.