簡體   English   中英

如何用Jsoup放棄部分網頁?

[英]How to abandon part of webpage with Jsoup?

我目前正在使用Jsoup來解析一個html。代碼很簡單:

Document doc = null;
    try{
        doc = Jsoup.connect(link).get();    
    }
    catch (Exception e) {
        //System.out.println("Some error occured.");
        textView.setText(e.getMessage());
    }

它確實給了我想要的網頁,稍后我可以使用它的 getElementsByTag 方法等從該網頁中提取我需要的數據。 但是,我只想使用網頁的一部分,例如,我希望放棄 <. -- / foo --> 在我的網頁中,(實際上 < 和之間沒有空格。?但我不能在這里輸入,)有沒有辦法在該字符串之后放棄網頁並獲取新文檔只有我想要的部分,我查了食譜。 但它似乎只處理網頁的結構。 所以我不太確定是否可以執行字符串刪除之類的操作。 感謝您的閱讀。

您可以使用 Document doc = Jsoup.parse(html),其中 HTML 是頁面 HTML。即首先使用 HTML

   Connection connect = Jsoup.connect(url);
   Connection.Response response = connect.execute();
   String html = response.body();

然后執行您需要的任何操作(例如在標記后剪切 HTML,但添加必要的關閉 HTML 標簽),然后

   Document doc = Jsoup.parse(html)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM