[英]regex - negative lookahead to exclude strings
我试图在文本中找到(并用其他东西替换)所有部分
(为了您的信息,我正在搜索和替换目录和文件名,因此应该排除“.”和“..”。)
这是我想出的正则表达式:
/(?!\.|\.\.)([^/]+)/
第二部分
([^/]+)
匹配每个字符序列,不包括“/”。 不需要字符限制,我只是解释输入。
第一部分
(?!\.|\.\.)
使用否定的前瞻断言来排除字符串 '.' 和 '..'。
但是,这在带有 mb_ereg_replace() 的 PHP 中似乎不起作用。
有人可以帮帮我吗? 我看不出我的正则表达式有什么问题。
谢谢你。
POSIX 正则表达式可能不支持负前瞻。 (虽然我可能错了)
无论如何,由于 PCRE 正则表达式通常比 POSIX 更快,我认为您可以使用相同 function 的 PCRE 版本,因为 PCRE 也支持 utf8 以及使用u
标志。
考虑将此代码作为替代:
preg_replace('~/(?!\.|\.\.)([^/]+)/~u', "", $str);
preg_replace('~/(?!\.)([^/]+)/~u', "", $str);
这有点冗长,但它确实有效:
#/((\.[^./][^/]*)|(\.\.[^/]+)|([^.][^/]*))/#
^ |------------| |---------| |---------|
| | | |
| | text starting with |
| | two dots, that isn't |
| | "." or ".." |
| text starting with |
| a dot, that isn't text not starting
| "." or ".." with a dot
|
delimiter
不匹配:
hi
//
/./
/../
是否匹配:
/hi/
/.hi/
/..hi/
/...
/在http://regexpal.com/上玩一下。
我不确定您是否要允许//
。 如果这样做,请在最后一个/
之前粘贴*
。
我不反对正则表达式,但我会这样做:
function simplify_path($path, $directory_separator = "/", $equivalent = true){
$path = trim($path);
// if it's absolute, it stays absolute:
$prepend = (substr($path,0,1) == $directory_separator)?$directory_separator:"";
$path_array = explode($directory_separator, $path);
if($prepend) array_shift($path_array);
$output = array();
foreach($path_array as $val){
if($val != '..' || ((empty($output) || $last == '..') && $equivalent)) {
if($val != '' && $val != '.'){
array_push($output, $val);
$last = $val;
}
} elseif(!empty($output)) {
array_pop($output);
}
}
return $prepend.implode($directory_separator,$output);
}
测试:
echo(simplify_path("../../../one/no/no/../../two/no/../three"));
// => ../../../one/two/three
echo(simplify_path("/../../one/no/no/../../two/no/../three"));
// => /../../one/two/three
echo(simplify_path("/one/no/no/../../two/no/../three"));
// => /one/two/three
echo(simplify_path(".././../../one/././no/./no/../../two/no/../three"));
// => ../../../one/two/three
echo(simplify_path(".././..///../one/.///./no/./no/../../two/no/../three/"));
// => ../../../one/two/three
我认为返回一个等效的字符串会更好,所以我尊重..
在字符串开头的出现。
如果你不想要它们,你可以用第三个参数 $equivalent = false 来调用它:
echo(simplify_path("../../../one/no/no/../../two/no/../three", "/", false));
// => one/two/three
echo(simplify_path("/../../one/no/no/../../two/no/../three", "/", false));
// => /one/two/three
echo(simplify_path("/one/no/no/../../two/no/../three", "/", false));
// => /one/two/three
echo(simplify_path(".././../../one/././no/./no/../../two/no/../three", "/", false));
// => one/two/three
echo(simplify_path(".././..///../one/.///./no/./no/../../two/no/../three/", "/", false));
// => one/two/three
/(?.(\.|\.\.)/)([^/]+)/
这将允许...
作为有效名称。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.