繁体   English   中英

preg_match_all PHP的条件正则表达式模式

[英]Conditional regex pattern for preg_match_all PHP

我有一个模式。 每当不存在特定的匹配组时,即使它跳过下一个匹配组,它也会跳过并找到另一个匹配项。

有4个捕获组。

第一组,第二组,第三组,第四组

第三组并不总是在那里。 在我的示例字符串中,有3套。 第一个不包含第三组的任何字符。 我需要第三组的条件声明。 如果找不到任何字符,则应捕获空格或空格。

演示: https//regex101.com/r/zK0aW4/1

它应该像这样: https : //regex101.com/r/sD4eB7/1

但我不知道如何为此分配条件。

如果不存在第三个匹配项,则应为空白。 如何以正则表达式模式编写此代码?

例如:

$string = "\nTHIS IS FIRST PATTERN 63101 0789158126 0-0000000-000-0000\n4415 THIS IS FIRST \nPATTERN 49401-9528\n0406842931 Third match 0-0000000-000-0000\n11403 THIS IS FIRST PATTERN 49401-\n9595\n0112853789 Third match 0-0000000-000-0000";

preg_match_all(
    "/([A-Z ,\.\-\&#\\\\n\/0-9&]+)(\d{10})([A-Z a-z]+)(\d{1}-\d{7}-\d{3}-\d{4}|\d{1}-\d{7}-\d{2}-\d{4})/",
    $string,
    $matches
);

这应该输出类似:

array(3) {
  [0]=>
  array(3) {
    [0]=>
    string(78) "\nTHIS IS FIRST PATTERN 63101 0789158126 0-0000000-000-0000"
    [1]=>
    string(84) "\n4415 THIS IS FIRST \nPATTERN 49401-9528\n0406842931 Third match 0-0000000-000-0000"
    [2]=>
    string(87) "\n11403 THIS IS FIRST PATTERN 49401-\n9595\n0112853789 Third match 0-0000000-000-0000"
  }
  [1]=>
  array(5) {
    [0]=>
    string(36) "\nTHIS IS FIRST PATTERN 63101"
    [1]=>
    string(42) "\n4415 THIS IS FIRST \nPATTERN 49401-9528\n"
    [2]=>
    string(45) "\n11403 THIS IS FIRST PATTERN 49401-\n9595\n"
  }
  [2]=>
  array(3) {
    [0]=>
    string(10) "0789158126"
    [1]=>
    string(10) "0406842931"
    [2]=>
    string(10) "0112853789"
  }
  [3]=>
  array(3) {
    [0]=>
    string(15) " "
    [1]=>
    string(15) " Third match "
    [2]=>
    string(15) " Third match "
  }
  [4]=>
  array(3) {
    [0]=>
    string(17) "0-0000000-000-0000"
    [1]=>
    string(17) "0-0000000-000-0000"
    [2]=>
    string(17) "0-0000000-000-0000"
  }
}

试试这个: https : //regex101.com/r/zK0aW4/2

((?:[A-Z ,.&#\/0-9-]|&|\\n)+?)(\d{10})([A-Z a-z]+)?(\d{1}-\d{7}-\d{3}-\d{4}|\d{1}-\d{7}-\d{2}-\d{4})

由于您的初始组有很多比赛,因此扩展范围过大。 通过更改为非贪婪或惰性匹配( *?+? ),它将尽可能少地匹配。 这使其在以下模式下表现更好。

字符类(由[]包围)用于匹配单个字符; 我假设您只想匹配文字& \\n ,因此将它们移出字符类。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM