使用 Jsoup 抓取网站元素时保留原始 Html 格式

Question

The below code only retrieves the simple text but I want to retain the HTML format.下面的代码只检索简单的文本，但我想保留 HTML 格式。 Here is my sample code:这是我的示例代码：

public class doIT extends AsyncTask<Void,Void,Void> {
    //String words = wordToTranslate;
    String translated;
    @Override
    protected void onPreExecute() {
        super.onPreExecute();

        
    }
    @Override
    protected Void doInBackground(Void... params) {
        try
        {
            Document document = Jsoup.connect("https://studentdevos.com/").get();
            org.jsoup.select.Elements elements = document.getElementsByClass("post-entry");

            translated = Jsoup.parse(elements.html()).wholeText();
            
        }
        catch (IOException e)
        {
            e.printStackTrace();
        } return null;
    }
    @Override
    protected void onPostExecute(Void aVoid)
    {

        tv_Jsoupe.setText(Html.fromHtml(translated));
        super.onPostExecute(aVoid);

    }
}

Answer 1

I think that the Jsoup.parse() is what retrieves the simple text.我认为 Jsoup.parse() 是检索简单文本的方法。

code:代码：

translated = elements.html();

Change this line as well from:也从以下位置更改此行：

tv_Jsoupe.setText(Html.fromHtml(translated));

to到

tv_Jsoupe.setText(translated);

使用 Jsoup 抓取网站元素时保留原始 Html 格式

问题描述

1 个解决方案

解决方案1
1 已采纳 2023-01-27 09:21:55

使用 Jsoup 抓取网站元素时保留原始 Html 格式

问题描述

1 个解决方案

解决方案1 1 已采纳 2023-01-27 09:21:55

解决方案1
1 已采纳 2023-01-27 09:21:55