[英]Is there a way to access specific attributes of html tags using Java/JSoup?
例如,代碼
Elements linksOnPage = htmlDocument.select("a[href]");
將返回所有帶有href屬性的標簽。 但是我想要<a>
標簽,其中有一個名為title的屬性,它等於“ XXX”。 另外,我希望所有<span>
標記的title屬性等於“ XXX”,並且還希望實際文本值在該span標記內。
是否有捷徑可尋?
您可以簡單地使用a[title=XXX]
,與span[title=XXX]
。
如果要在一個select(..)
查詢中找到它們,則可以使用逗號分隔多個選擇器,例如用逗號分隔
Elements linksOnPage = htmlDocument.select("a[title=XXX], span[title=XXX]");
如果要獲取將由選定標簽生成的文本,則可以在其上調用text()
方法。
您可以在官方教程中找到有關選擇器的更多信息: http : //jsoup.org/cookbook/extracting-data/selector-syntax
為了檢查屬性是否與XXX
匹配,您可以檢查linksOnPage.attr("title")
是否等於XXX
。 可以使用jsoup中的text()函數提取span標簽的主體,您可以從externalHtml()函數獲取整個標簽
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.