繁体   English   中英

使用 xPath 从父节点和后代节点中提取文本

[英]Extract text from parent node and descendant nodes w/ xPath

如果我在 XML 文件中有这些标签:

<a> Hello, I would like
   <b> to eat, please. </b>
</a>

或这些(更复杂):

<a> Hello, 
   <b class="A"> I would like</b>
   <b> to </b>
   <b/>
   eat, please.
</a>

,我将如何从ab中提取文本,以便 output 为:

Hello, I would like to eat, please.


我最接近使用.//b[preceding-sibling::text()] ,但这给了我一个或另一个的文本,而不是组合它们。

不知道这是否重要,但我在 python 中执行此操作,因此代码将是element.xpath('string(.//b[preceding-sibling::text()])')使用 lxml。

此 XPath,

normalize-space(/a)

将返回a元素的空间标准化字符串值

Hello, I would like to eat, please.

按照要求。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM