[英]Is there a way to access specific attributes of html tags using Java/JSoup?
例如,代码
Elements linksOnPage = htmlDocument.select("a[href]");
将返回所有带有href属性的标签。 但是我想要<a>
标签,其中有一个名为title的属性,它等于“ XXX”。 另外,我希望所有<span>
标记的title属性等于“ XXX”,并且还希望实际文本值在该span标记内。
是否有捷径可寻?
您可以简单地使用a[title=XXX]
,与span[title=XXX]
。
如果要在一个select(..)
查询中找到它们,则可以使用逗号分隔多个选择器,例如用逗号分隔
Elements linksOnPage = htmlDocument.select("a[title=XXX], span[title=XXX]");
如果要获取将由选定标签生成的文本,则可以在其上调用text()
方法。
您可以在官方教程中找到有关选择器的更多信息: http : //jsoup.org/cookbook/extracting-data/selector-syntax
为了检查属性是否与XXX
匹配,您可以检查linksOnPage.attr("title")
是否等于XXX
。 可以使用jsoup中的text()函数提取span标签的主体,您可以从externalHtml()函数获取整个标签
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.