Xpath-从div中的所有h1，h3 p标签获取文本

Question

我目前正在使用以下查询来提取<h1> <p>和<h3>标记内的文本。

$xpath->query("//div[contains(concat(' ', normalize-space(@class), ' '), ' grid_9 alpha omega newscontainer arena ')]/h1");
$xpath->query("//div[contains(concat(' ', normalize-space(@class), ' '), ' grid_9 alpha omega newscontainer arena ')]/p");
$xpath->query("//div[contains(concat(' ', normalize-space(@class), ' '), ' grid_9 alpha omega newscontainer arena ')]/h3");

它们有时确实会以不同的顺序出现，所以我想按它们在html中出现的顺序来捕捉它们。 我用过

$xpath->query('//h1 | //p | //h3');

效果很好，但在上面指定的div类之外也捕获了一些<p>标记。 依次使用它们根本不起作用。 有没有办法将这些查询组合成一个查询？

基本上提取特定div类中的所有h1，p和h3标签？

Answer 1

你为什么不尝试

$xpath->query("//div[contains(concat(' ', normalize-space(@class), ' '), ' grid_9 alpha omega newscontainer arena ')]/*[local-name()='h1' or local-name()='p' or local-name()='h3']");

这应该按照节点的出现顺序（仅限于div父级的子级）以及XPath 1.0中的顺序为您提供节点，我认为这是一个未提及的先决条件。

Answer 2

当您使用//时，将匹配具有此标记名的任何元素

您必须更具体，我建议您

$xpath->query('//div/h1 | //div/p | //div/h3');

Xpath-从div中的所有h1，h3 p标签获取文本

问题描述

2 个解决方案

解决方案1
0 已采纳 2013-12-04 23:12:15

解决方案2
0 2013-12-04 23:14:22

Xpath-从div中的所有h1，h3 p标签获取文本

问题描述

2 个解决方案

解决方案1 0 已采纳 2013-12-04 23:12:15

解决方案2 0 2013-12-04 23:14:22

解决方案1
0 已采纳 2013-12-04 23:12:15

解决方案2
0 2013-12-04 23:14:22