繁体   English   中英

使捕获组在正则表达式中为可选

[英]Making a capturing group optional in a regex

我有一个自动生成的电子邮件,试图将其解析为字段以导入到应用程序中。 如果所有字段都存在,我可以使用正则表达式。 但是,情况并非总是如此。 具体来说,电话号码有时会丢失。

$regex = '/Bill\sTo:\s+([A-Za-z]+\s[A-Za-z]+)\s.+[A-Z]{2}\s(\d{5})\s.*\s((?:\([2-9]\d{2}\)\ ?|[2-9]\d{2}(?:\-?|\ ?))[2-9]\d{2}[- ]?\d{4})\s+([A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4})\s+Ship\sTo:/s';
//                     ^       Name         ^    ^State ^  ^ Zip ^      ^                       Phone Number                            ^   ^                      Email                    ^

if (preg_match($regex, $content, $matches)) {
    $import = new ImportedEmail;

    $import->name = $matches[1];
    $import->zip = $matches[2];
    $import->phone = $matches[3];
    $import->email = $matches[4];

    // ...more processing code follows.
}

我如何获取它来提取一个存在的电话号码,否则将一个NULL放入$import->phone呢?

请注意,“ State”位于正则表达式中,只是为了帮助使邮政编码位置为零。

您可以给捕获组起一个名字 (?P<name> ...)并使用?使其可选?

我准备了一个简化的例子。 假设您有一个类似的字符串:

name [age (optional)] message:

您可以使用以下正则表达式进行解析:

// Jon is 37 years old 
$str1 = 'jon 37 hello world';
// Jane does not tell about her age ;)
$str2 = 'jane foo bar';

preg_match('/(?P<name>[a-z]+ )?(?P<age>[0-9]+ )?(?P<message>.*)/', $str1, $m);    
echo $m['name'] . PHP_EOL;
echo $m['age'] . PHP_EOL;
echo $m['message'] . PHP_EOL;


preg_match('/(?P<name>[a-z]+ )?(?P<age>[0-9]+ )?(?P<message>.*)/', $str2, $m);    
echo $m['name'] . PHP_EOL;
echo $m['age'] . PHP_EOL; // index exists but is now empty
echo $m['message'] . PHP_EOL;

放一个? 直接在您的电话号码捕获组之后。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM