繁体   English   中英

正则表达式 - 排除字符串的负前瞻

[英]regex - negative lookahead to exclude strings

我试图在文本中找到(并用其他东西替换)所有部分

  1. 从...开始 '/'
  2. 以。。结束 '/'
  3. 在两个 / 之间可以有任何东西,除了字符串 '.' 和 '..'。

(为了您的信息,我正在搜索和替换目录和文件名,因此应该排除“.”和“..”。)

这是我想出的正则表达式:

/(?!\.|\.\.)([^/]+)/

第二部分

([^/]+)

匹配每个字符序列,不包括“/”。 不需要字符限制,我只是解释输入。

第一部分

(?!\.|\.\.)

使用否定的前瞻断言来排除字符串 '.' 和 '..'。

但是,这在带有 mb_ereg_replace() 的 PHP 中似乎不起作用。

有人可以帮帮我吗? 我看不出我的正则表达式有什么问题。

谢谢你。

POSIX 正则表达式可能不支持负前瞻。 (虽然我可能错了)

无论如何,由于 PCRE 正则表达式通常比 POSIX 更快,我认为您可以使用相同 function 的 PCRE 版本,因为 PCRE 也支持 utf8 以及使用u标志。

考虑将此代码作为替代:

preg_replace('~/(?!\.|\.\.)([^/]+)/~u', "", $str);

编辑:更好的是使用:

preg_replace('~/(?!\.)([^/]+)/~u', "", $str);

这有点冗长,但它确实有效:

#/((\.[^./][^/]*)|(\.\.[^/]+)|([^.][^/]*))/#
^  |------------| |---------| |---------|
|        |             |               |
|        |        text starting with   |
|        |        two dots, that isn't |
|        |             "." or ".."     |
|  text starting with                  |
|  a dot, that isn't                text not starting
|  "." or ".."                         with a dot
|
delimiter

不匹配:

  • hi
  • //
  • /./
  • /../

是否匹配:

  • /hi/
  • /.hi/
  • /..hi/
  • /... /

http://regexpal.com/上玩一下。

我不确定您是否要允许// 如果这样做,请在最后一个/之前粘贴*

我不反对正则表达式,但我会这样做:

function simplify_path($path, $directory_separator = "/", $equivalent = true){
  $path = trim($path);
  // if it's absolute, it stays absolute:
  $prepend = (substr($path,0,1) == $directory_separator)?$directory_separator:"";
  $path_array = explode($directory_separator, $path);
  if($prepend) array_shift($path_array);
  $output = array();
  foreach($path_array as $val){
    if($val != '..' || ((empty($output) || $last == '..') && $equivalent)) {
      if($val != '' && $val != '.'){
        array_push($output, $val);
        $last = $val;
      }
    } elseif(!empty($output)) {
        array_pop($output);
    }
  }
  return $prepend.implode($directory_separator,$output);
}

测试:

echo(simplify_path("../../../one/no/no/../../two/no/../three"));
// =>  ../../../one/two/three
echo(simplify_path("/../../one/no/no/../../two/no/../three"));
// =>  /../../one/two/three
echo(simplify_path("/one/no/no/../../two/no/../three"));
// =>  /one/two/three
echo(simplify_path(".././../../one/././no/./no/../../two/no/../three"));
// =>  ../../../one/two/three
echo(simplify_path(".././..///../one/.///./no/./no/../../two/no/../three/"));
// =>  ../../../one/two/three

我认为返回一个等效的字符串会更好,所以我尊重..在字符串开头的出现。

如果你不想要它们,你可以用第三个参数 $equivalent = false 来调用它:

echo(simplify_path("../../../one/no/no/../../two/no/../three", "/", false));
// =>  one/two/three
echo(simplify_path("/../../one/no/no/../../two/no/../three", "/", false));
// =>  /one/two/three
echo(simplify_path("/one/no/no/../../two/no/../three", "/", false));
// =>  /one/two/three
echo(simplify_path(".././../../one/././no/./no/../../two/no/../three", "/", false));
// =>  one/two/three
echo(simplify_path(".././..///../one/.///./no/./no/../../two/no/../three/", "/", false));
// =>  one/two/three

/(?.(\.|\.\.)/)([^/]+)/这将允许...作为有效名称。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM