簡體   English   中英

如何將Jsoup(Java html解析器)中生成的文檔轉換為字符串

[英]How do I convert a document made in Jsoup (the Java html parser) into a string

我有一個jsoup中的文檔,看起來像這樣

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

如何將該doc轉換為字符串。

你有沒有嘗試過:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

隨着Document擴展Element ,它還獲得了根據API獲取 “檢索元素的內部HTML”的方法html() 這應該工作:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

附加信息:

每個Document對象都有一個對內部類Document.OutputSettings實例的引用,可以通過Document的outputSettings()方法訪問它。 在那里,您可以使用setter prettyPrint(true / false)啟用/禁用漂亮打印。 有關詳細信息,請參閱API for DocumentDocument.OutputSettings

doc.toString()doc.outerHtml()

 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

在將字符串解析為文檔之后,您可以使用它來處理文檔功能

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM