[英]Jsoup - Get Parent
我有一些HTML,并且正在尝试获取链接,并且我知道我想要的链接具有一些品质,因此我可以轻松找到它,但我也不想在上方获得<h2 calss='locs'>
标签我有链接。 因此,html可能看起来像这样
<html>
<body>
<h2 class = 'locs'>text</h2>
<p>
<a link and stuff...>
</p>
<h2 class = 'locs'>foo</h2>
<p>
<a another link and stuff...>
</p>
</body>
</html>
但是<h2>
并不总是<a>
的第一个父项,因此有没有办法搜索链接之前的?
谢谢您的帮助
我不确定您要问的是什么,但这是我的假设:您想要在class locs
的h2
Element之后的第a
Element。
为此,您不能使用parent()
方法,因为a
元素的父元素似乎是p
元素,而这些元素又是h2.locs
元素的h2.locs
元素(而不是子元素)。 这是我会做的:
Elements as = doc.select("h2.locs + p>a");
说明:
h2.locs
使用类locs查找h2 h2.locs
A + B
查找必须与先前A直接同级的B。 p>a
寻找a
它们的子元素p
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.