簡體   English   中英

有沒有一種方法可以使用Java / JSoup訪問html標簽的特定屬性?

[英]Is there a way to access specific attributes of html tags using Java/JSoup?

例如,代碼

Elements linksOnPage = htmlDocument.select("a[href]");

將返回所有帶有href屬性的標簽。 但是我想要<a>標簽,其中有一個名為title的屬性,它等於“ XXX”。 另外,我希望所有<span>標記的title屬性等於“ XXX”,並且還希望實際文本值在該span標記內。

是否有捷徑可尋?

您可以簡單地使用a[title=XXX] ,與span[title=XXX]

如果要在一個select(..)查詢中找到它們,則可以使用逗號分隔多個選擇器,例如用逗號分隔

Elements linksOnPage = htmlDocument.select("a[title=XXX], span[title=XXX]");

如果要獲取將由選定標簽生成的文本,則可以在其上調用text()方法。

您可以在官方教程中找到有關選擇器的更多信息: http : //jsoup.org/cookbook/extracting-data/selector-syntax

為了檢查屬性是否與XXX匹配,您可以檢查linksOnPage.attr("title")是否等於XXX 可以使用jsoup中的text()函數提取span標簽的主體,您可以從externalHtml()函數獲取整個標簽

好吧,根據此文檔

您可以通過以下方式選擇哪些標簽是XXXhtmlDocument.select("a[title="+XXX+"]");

對於標簽內的數據: tag.text()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM