繁体   English   中英

如何使用preg_match从此PHP字符串中提取数据?

[英]How to extract data from this PHP string using preg_match?

从以下php字符串中提取数据数组(5436,342w5 ...)中的内容的最佳方法是什么:

series: [{
    type: 'area',
    name: 'product_data',
    data: [ 5436, 342w5, 564s5, 6778, 8954, 567e5, 6578, 67584 ]
}]

以下内容?

preg_match("/(.*), (.*)/", $input_line, $output_array);

提前致谢 :)

编辑:完整的代码如下

PHP:

    $file = "file.html";
    $file = file_get_contents($file);

    $input_line = strip_tags($file);

    $data = preg_match("/(.*), (.*)/", $input_line, $output_array);

    print_r($output_array);

file.html:

<!DOCTYPE>
 <html>
 <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Index</title>

    <script type="text/javascript">
        var chart;
        jQuery(document).ready(function() {
            chart = new Highcharts.Chart({
                series: [{
                    type: 'area',
                    name: 'product_data',
                    data: [ 5436, 342w5, 564s5, 6778, 8954, 567e5, 6578, 67584 ]
                }]
            });
        });
    </script>

    <body>

    </body>
</head>

您可以使用此模式进行操作,这不是更简单的方法,但是可以一次完成并且非常有效:

$pattern = "~
(?:
    \G(?!\A),  # anchored to the previous match
  |
    \A         # anchored at the start of the string
    [^s]*(?:s(?!eries:)[^s]*)*  # all until 'series:'
    series:
    [^'d]*(?:'[^']*'[^'d]*|\Bd|d(?!ata:))* # all until 'data:'
    data:
    \s*\[
)
\s*\K    # remove all on the left from the result
[^], ]+  # match the item
~x";

if (preg_match_all($pattern, $str, $m))
    print_r($m[0]);

演示

您可以使用一种更常规的方法,该方法包括首先提取数组,然后将其分解为项目:

$pattern = '~\bdata: \[\K[^]]+~';

if (preg_match($pattern, $str, $m)) {
    $items = explode(', ', trim($m[0]));
    print_r($items);
} 

或者只是这样:

preg_match('#data:\s\[(.*)\]#', $input_line, $output_array);
$data = explode(',', $output_array[1]);
print_r($data);

不完全是您要寻找的答案,但是这里...

数据是JSON编码的,但是PHP要理解它,需要进行一些调整:

$:~/testscripts> cat js.php
<?php

// Raw data

$input_line=<<<STRING1
series: [{
    type: 'area',
    name: 'product_data',
    data: [ 5436, 342w5, 564s5, 6778, 8954, 567e5, 6578, 67584 ]
}]
STRING1;

$data=json_decode($input_line,true);

echo "Decoded: ".print_r($data,true).PHP_EOL;

echo "---------------------".PHP_EOL;
// Adjust format

$d2=<<<STRING2
{"series": [{
    "type":"area",
    "name": "product_data",
    "data": [ "5436", "342w5", "564s5", "6778", "8954", "567e5", "6578", "67584" ]
}]
}
STRING2;

$dd2=json_decode($d2,true);
echo "Decoded D2: ".print_r($dd2,true).PHP_EOL;

echo "---------------------".PHP_EOL;

// Reverse

$a=array(
    'series'=>array(
        array(
            'type'=>'area',
            'name'=>'product_data',
            'data'=>array('5436','342w5','564s5', '6778', '8954', '567e5', '6578', '67584')
        )
    )
);

echo "Encoded: ".json_encode($a).PHP_EOL;

$series=$a['series'];
$dummy=reset($series); // return the first element of array
$data=$dummy['data'];

echo "Data: ".print_r($data,true).PHP_EOL;

并且,当您运行上述内容时,您会得到:

$~/testScripts> php -f js.php 
Decoded: 
---------------------
Decoded D2: Array
(
    [series] => Array
        (
            [0] => Array
                (
                    [type] => area
                    [name] => product_data
                    [data] => Array
                        (
                            [0] => 5436
                            [1] => 342w5
                            [2] => 564s5
                            [3] => 6778
                            [4] => 8954
                            [5] => 567e5
                            [6] => 6578
                            [7] => 67584
                        )
                )
        )
)

---------------------
Encoded: {"series":[{"type":"area","name":"product_data","data":["5436","342w5","564s5","6778","8954","567e5","6578","67584"]}]}
Data: Array
(
    [0] => 5436
    [1] => 342w5
    [2] => 564s5
    [3] => 6778
    [4] => 8954
    [5] => 567e5
    [6] => 6578
    [7] => 67584
)

可以看出,即使$input_line和执行json_encode的结果相似,也只有调整后的原始数据才能正常工作。

您需要通过以下方式来调整$input_line :将所有内容括在语音标记( "而不是' )中,并在开头和结尾添加花括号(可以使用一组更简单的正则表达式),然后将通过json_decode函数( true返回一个数组)。此后,应该是访问数组元素的简单情况

抱歉,这不是您想要的代码。 只是想我会添加另一个可能更简单的选项。 或者可能不是

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM