通過JSOUP解析時不希望創建文檔結構

Question

我正在使用Jsoup API使用Jsoup.parse（）方法來解析HTML的一部分。 但是，在解析時會將文檔結構添加到HTML內容中。

例如：

<p><a href="some link">some link data</a> Some paragraph content</p>

成為

<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>

解析后，我不需要文檔結構（我不需要html，head，body標簽）。 有什么辦法嗎？ 提前致謝。

解

我使用了Document的body（）和html（）方法

Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()

謝謝你的建議。

Answer 1

您可以選擇身體元素的孩子：

Document doc = Jsoup.parse("<p><a href=\"some link\">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();