使用 xPath 从父节点和后代节点中提取文本

Question

如果我在 XML 文件中有这些标签：

<a> Hello, I would like
   <b> to eat, please. </b>
</a>

或这些（更复杂）：

<a> Hello, 
   <b class="A"> I would like</b>
   <b> to </b>
   <b/>
   eat, please.
</a>

，我将如何从a和b中提取文本，以便 output 为：

Hello, I would like to eat, please.

我最接近使用.//b[preceding-sibling::text()] ，但这给了我一个或另一个的文本，而不是组合它们。

不知道这是否重要，但我在 python 中执行此操作，因此代码将是element.xpath('string(.//b[preceding-sibling::text()])')使用 lxml。

Answer 1

此 XPath，

normalize-space(/a)

将返回a元素的空间标准化字符串值，

Hello, I would like to eat, please.

按照要求。

使用 xPath 从父节点和后代节点中提取文本

问题描述

1 个解决方案

解决方案1
3 已采纳 2020-05-14 14:04:08

使用 xPath 从父节点和后代节点中提取文本

问题描述

1 个解决方案

解决方案1 3 已采纳 2020-05-14 14:04:08

解决方案1
3 已采纳 2020-05-14 14:04:08