[英]How do I convert a document made in Jsoup (the Java html parser) into a string
我有一個jsoup中的文檔,看起來像這樣
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
如何將該doc
轉換為字符串。
你有沒有嘗試過:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();
隨着Document擴展Element ,它還獲得了根據API獲取 “檢索元素的內部HTML”的方法html() 。 這應該工作:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();
附加信息:
每個Document對象都有一個對內部類Document.OutputSettings實例的引用,可以通過Document的outputSettings()方法訪問它。 在那里,您可以使用setter prettyPrint(true / false)啟用/禁用漂亮打印。 有關詳細信息,請參閱API for Document和Document.OutputSettings
doc.toString()
和doc.outerHtml()
。
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements post = doc.select("div.post-content");
String dd = post.toString();
Document ddd = Jsoup.parse(dd);
在將字符串解析為文檔之后,您可以使用它來處理文檔功能
Elements scriptTag = ddd.getElementsByTag("script");
System.out.println(scriptTag);
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.