簡體   English   中英

使用JSOUP從HTML獲取字符串

[英]Getting Strings from HTML with JSOUP

我需要使用JSOUP從HTML獲取字符串的幫助。

該文檔的構建方式如下:

<body>
   <span class="a-touch">
      <div class"a-container">
         <div class"a-box">
            <div class="a-row a-spacing-small">
              <b>string1</b><br/>string2 97<br/>String3
              <br/>string4</>string5<br/>
          </div>

現在我需要得到琴弦。 我用谷歌搜索,但只能找到表格等的示例。

以下代碼為您提供一個strings數組,其中包含a-row div的文本內容,並按換行符分隔:

Document doc = Jsoup.parseBodyFragment(html);
Elements a_row_div = doc.select(".a-row");
String[] strings = Jsoup.clean(a_row_div.html(), "", Whitelist.none(), 
    new OutputSettings().prettyPrint(false)).split("\n");

這些字符串都存儲在TextNode的TextNode中。

使用(Node n : Element.childNodes()收集到超過遍歷所有的節點是通常相關的唯一節點類型元素或TextNode的使用。 if (n instanceof TextNode)來測試,並在所有的innerText運作, if (n instanceof Element)對所有子元素進行遞歸調用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM