[英]Don't want the document structure to be created while parsing through JSOUP
我正在使用Jsoup API使用Jsoup.parse()方法來解析HTML的一部分。 但是,在解析時會將文檔結構添加到HTML內容中。
例如:
<p><a href="some link">some link data</a> Some paragraph content</p>
成為
<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>
解析后,我不需要文檔結構(我不需要html,head,body標簽)。 有什么辦法嗎? 提前致謝。
解
我使用了Document的body()和html()方法
Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()
謝謝你的建議。
您可以選擇身體元素的孩子:
Document doc = Jsoup.parse("<p><a href=\"some link\">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.