[英]How do I retrieve text that comes that comes after the <strong> tag using Beautiful Soup?
[英]Xpath: How to check if a tag comes before text or after text?
假设我有以下两个 HTML 的示例片段:
<p>This is some text: <b>ABCD12345</b></p>
<p><b>Name:</b> John Doe</p>
我能够将<b>
和非<b>
部分分开,但我(也)想知道如何确定<b>
部分是在文本的开头还是结尾(换句话说; 之前或之后是否有文本)。 怎么做?
如果重要的话,我正在使用 Python(带 lxml)(我认为它真的不重要)。
这个XPath,
not(/p/b/following-sibling::text())
如果p
中的b
之后没有文本节点,则将返回 true,如第一种情况:
<p>This is some text: <b>ABCD12345</b></p>
这个XPath,
not(/p/b/preceding-sibling::text())
如果p
中b
之前没有文本节点,则将返回 true,如第二种情况:
<p><b>Name:</b> John Doe</p>
如果感兴趣的不是缺少而是存在b
元素之前/之后的文本,您可以将那些 XPath 表达式中的not()
更改为boolean()
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.