繁体   English   中英

PHP Regexp:忽略定义的子字符串之前的所有内容

[英]PHP Regexp: ignoring everything before a defined substring

我正在尝试解析网页。 基本上,它存储在一个如下所示的字符串中:

"[HTML CODE ...]world:[HTML CODE ...]my_number[REST OF HTML_CODE ...]"

当然,“ world:”和“ MY_NUMBER”是html代码的一部分,但是我想在第一次出现“ world:”之前忽略所有内容。 我需要的是第一个出现在“ world:”之后的第一个数字,请记住,在它们之间会有一堆html代码。 我可以将html代码子字符串化,但是如果可能的话,我只想通过使用一个正则表达式来完成所有这些工作。

这是我尝试匹配的正则表达式:

'/(?<=world:)\D+?[0-9]+/'

但这会返回“ world:”和我的电话号码之间的所有html内容。

谢谢!

我认为您快要掌握了。 我能够在您提供的字符串上使用它。

$subject = "[HTML CODE ...]world:[HTML CODE ...]3334[REST OF HTML_CODE ...]";
$pattern = "/world:\D+?(?<my_number>[0-9]+)/";
$matches = array();

$result =  preg_match_all($pattern, $subject, &$matches);

print_r($matches);

结果是:

Array
(
    [0] => Array
        (
            [0] => world:[HTML CODE ...]3334
        )

    [my_number] => Array
        (
            [0] => 3334
        )

    [1] => Array
        (
            [0] => 3334
        )

)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM