JTidy Node.findBody（） - 如何使用？

Question

我正在嘗試用JTidy進行XHTML DOM解析，這似乎是違反直覺的任務。 特別是，有一種解析HTML的方法：

Node Tidy.parse(Reader, Writer)

為了獲得該節點的<body />，我認為，我應該使用

Node Node.findBody(TagTable)

我應該在哪里獲得該TagTable的實例？ （構造函數受到保護，我還沒有找到工廠來生產它。）

我使用JTidy 8.0-SNAPSHOT。

Answer 1

我發現有更簡單的方法來提取身體：

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

然后在Reader-Writer對上使用整潔。

應該是簡單的。

Answer 2

您可以使用parseDOM方法，這將為您提供org.w3c.dom.Document ：

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);