php DomXPath-如何从nodeValue剥离html标签及其内容？

Question

在这段代码中

<root>
    <main>
        <cont>
            <p>hello<a>world</a></p>
            <p>hello</p>
            <p>hello<a>world</a></p>
        </cont>
    </main>
</root>

我只需要在<cont>标记内获取文本。 没有获取<a>标签its contents

因此，结果将是hello hello hello没有world

Answer 1

一个simplexml_load_string()或simplexml_load_file()应该足够：

$xml_string = '<root> <main> <cont> <p>hello<a>world</a></p> <p>hello</p> <p>hello<a>world</a></p> </cont> </main></root>';
$xml = simplexml_load_string($xml_string);
$p = $xml->main->cont->p;
foreach($p as $value) {
    $parapgraphs[] = (string) $value;
}

echo '<pre>';
print_r($parapgraphs);

应该显示如下内容：

Array
(
    [0] => hello
    [1] => hello
    [2] => hello
)

Answer 2

您可以选择作为每个<p>标记的直接后代的文本节点：

$dom = new DOMDocument;
$dom->loadXml($xmlData);

$xpath = new DOMXpath($dom);

foreach ($xpath->query('//cont/p/text()') as $text) {
    echo $text->textContent, "\n";
}

php DomXPath-如何从nodeValue剥离html标签及其内容？

问题描述

2 个解决方案

解决方案1
1

解决方案2
1 已采纳 2014-06-29 12:45:34

php DomXPath-如何从nodeValue剥离html标签及其内容？

问题描述

2 个解决方案

解决方案1 1

解决方案2 1 已采纳 2014-06-29 12:45:34

解决方案1
1

解决方案2
1 已采纳 2014-06-29 12:45:34