簡體   English   中英

使用 Jsoup 抓取網站元素時保留原始 Html 格式

[英]Keep the original Html format when scrapping a website element using Jsoup

下面的代碼只檢索簡單的文本,但我想保留 HTML 格式。 這是我的示例代碼:

public class doIT extends AsyncTask<Void,Void,Void> {
    //String words = wordToTranslate;
    String translated;
    @Override
    protected void onPreExecute() {
        super.onPreExecute();

        
    }
    @Override
    protected Void doInBackground(Void... params) {
        try
        {
            Document document = Jsoup.connect("https://studentdevos.com/").get();
            org.jsoup.select.Elements elements = document.getElementsByClass("post-entry");

            translated = Jsoup.parse(elements.html()).wholeText();
            
        }
        catch (IOException e)
        {
            e.printStackTrace();
        } return null;
    }
    @Override
    protected void onPostExecute(Void aVoid)
    {

        tv_Jsoupe.setText(Html.fromHtml(translated));
        super.onPostExecute(aVoid);

    }
}

我認為 Jsoup.parse() 是檢索簡單文本的方法。

代碼:

translated = elements.html();

也從以下位置更改此行:

tv_Jsoupe.setText(Html.fromHtml(translated));

tv_Jsoupe.setText(translated);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM