簡體   English   中英

使用jsoup清理源代碼解析網站

[英]Clean source code parse website with jsoup

當由Java jsoup網站分析時,我想刪除每個img標簽中的/>

資源:

<div>
    <a href="#">ABC</a> 
    <a href="#"><img src="#"/></a>
    <br/>
</div>

結果:

<div>
    <a href="#">ABC</a> 
    <a href="#"><img src="#"></a>
    <br/>
</div>

嘗試html()方法

public class Test {
    public static void main(String[] args) {
        String s="<div>\n" +
                "    <a href=\"#\">ABC</a> \n" +
                "    <a href=\"#\"><img src=\"#\"/></a>\n" +
                "    <br/>\n" +
                "</div>";
        System.out.println(Jsoup.parse(s).html());
    }
}

輸出:

<html>
 <head></head>
 <body>
  <div> 
   <a href="#">ABC</a> 
   <a href="#"><img src="#"></a> 
   <br> 
  </div>
 </body>
</html>

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM