繁体   English   中英

有没有一种方法可以使用Java / JSoup访问html标签的特定属性?

[英]Is there a way to access specific attributes of html tags using Java/JSoup?

例如,代码

Elements linksOnPage = htmlDocument.select("a[href]");

将返回所有带有href属性的标签。 但是我想要<a>标签,其中有一个名为title的属性,它等于“ XXX”。 另外,我希望所有<span>标记的title属性等于“ XXX”,并且还希望实际文本值在该span标记内。

是否有捷径可寻?

您可以简单地使用a[title=XXX] ,与span[title=XXX]

如果要在一个select(..)查询中找到它们,则可以使用逗号分隔多个选择器,例如用逗号分隔

Elements linksOnPage = htmlDocument.select("a[title=XXX], span[title=XXX]");

如果要获取将由选定标签生成的文本,则可以在其上调用text()方法。

您可以在官方教程中找到有关选择器的更多信息: http : //jsoup.org/cookbook/extracting-data/selector-syntax

为了检查属性是否与XXX匹配,您可以检查linksOnPage.attr("title")是否等于XXX 可以使用jsoup中的text()函数提取span标签的主体,您可以从externalHtml()函数获取整个标签

好吧,根据此文档

您可以通过以下方式选择哪些标签是XXXhtmlDocument.select("a[title="+XXX+"]");

对于标签内的数据: tag.text()

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM