[英]parsing a XML file in java
我已經寫了一個SAX解析器。 當attibute值嵌套在雙引號中時,它可以正常工作。 但是,如果我不使用引號,則會引發異常。 我希望解析器解析其屬性值不在引號內的XML文件。 我想解析以下文件類型:
<root>
<tag1 attribute1=value1 > my data </tag1>
</root>
請注意,value1不在引號內
我可以讓我的解析器解析以上文件嗎? 如果是,怎么辦?
SAX解析器不會讀到它,因為它不是格式正確的XML 。 所有屬性值都必須用單引號或雙引號引起來。
要使解析器讀取它,您會發現必須使用相關的庫對它進行整理/凈化/修復。
試試NekoHTML( http://nekohtml.sourceforge.net/usage.html )
例如
package sample;
import org.apache.xerces.parsers.AbstractSAXParser;
import org.cyberneko.html.HTMLConfiguration;
public class HTMLSAXParser extends AbstractSAXParser {
public HTMLSAXParser() {
super(new HTMLConfiguration());
}
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.