簡體   English   中英

如何在類名中提取帶有特定單詞的 HTML 標簽?

[英]How to extract HTML tag with a specific word inside class name?

我將如何找到並提取具有類名的 html 標記。 但是,就我而言,我不會知道整個班級名稱,只知道一個詞。 例如,在以下 html 文件中,我想提取帶有 class ="by line vcard top-line"的 cite 標記,但我只知道該類包含 vcard? 我正在使用 jsoup。

<div class="credit">
    <div class="credit-text">
         <cite class="byline vcard top-line">
                By Taylor Hill | Takepart.com
                <abbr>July 28, 2015 3:27 PM</abbr>
          </cite>
          <span class="bottom-line">
             <a href="http://www.takepart.com/" data ylk=ltxt:TakePartcom;">
             <span class="provider-name">TakePart.com</span></a>
          </span>
        </div>
     </div>
   </div>

我剛剛快速瀏覽了 jsoup(我第一次聽說它),看起來您可以通過 getElementsByClass(String className) 方法找到基於其類的所需元素

所以在你的情況下你會使用: getElementsByClass("var")

那只會給你元素。 要獲取其內容,您似乎必須調用 html() 方法。

所以你的代碼看起來或多或少是這樣的:

Elements links = content.getElementsByClass("var");
for (Element link : links) {
   String linkHtmlContents = link.html();
}

http://jsoup.org/cookbook/extracting-data/dom-navigation

我相信您可以通過在 vcard 類上調用 html() 函數來通過 JQuery 實現相同的效果。 如:

$(".vcard").html()

這應該返回第一個匹配元素的 HTML 內容,因此您可以在循環中執行此操作以獲取每個元素,或者使用 text() 函數獲取所有元素的內容。

更多信息: http : //api.jquery.com/html/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM