Xpath：如何检查标签是在文本之前还是在文本之后？

Question

假设我有以下两个 HTML 的示例片段：

This is some text: ABCD12345

Name: John Doe

我能够将和非部分分开，但我（也）想知道如何确定部分是在文本的开头还是结尾（换句话说; 之前或之后是否有文本）。 怎么做？

如果重要的话，我正在使用 Python（带 lxml）（我认为它真的不重要）。

Answer 1

这个XPath，

not(/p/b/following-sibling::text())

如果p中的b之后没有文本节点，则将返回 true，如第一种情况：

<p>This is some text: <b>ABCD12345</b></p>

这个XPath，

not(/p/b/preceding-sibling::text())

如果p中b之前没有文本节点，则将返回 true，如第二种情况：

<p><b>Name:</b> John Doe</p>

如果感兴趣的不是缺少而是存在b元素之前/之后的文本，您可以将那些 XPath 表达式中的not()更改为boolean() 。