[英]JTidy Node.findBody() — How to use?
我正在嘗試用JTidy進行XHTML DOM解析,這似乎是違反直覺的任務。 特別是,有一種解析HTML的方法:
Node Tidy.parse(Reader, Writer)
為了獲得該節點的<body />,我認為,我應該使用
Node Node.findBody(TagTable)
我應該在哪里獲得該TagTable的實例? (構造函數受到保護,我還沒有找到工廠來生產它。)
我使用JTidy 8.0-SNAPSHOT。
我發現有更簡單的方法來提取身體:
tidy = new Tidy(); tidy.setXHTML(true); tidy.setPrintBodyOnly(true);
然后在Reader-Writer對上使用整潔。
應該是簡單的。
您可以使用parseDOM
方法,這將為您提供org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.