簡體   English   中英

用Java解析XML文件

[英]parsing a XML file in java

我已經寫了一個SAX解析器。 當attibute值嵌套在雙引號中時,它可以正常工作。 但是,如果我不使用引號,則會引發異常。 我希望解析器解析其屬性值不在引號內的XML文件。 我想解析以下文件類型:

<root>
    <tag1 attribute1=value1 > my data  </tag1>
</root>

請注意,value1不在引號內

我可以讓我的解析器解析以上文件嗎? 如果是,怎么辦?

SAX解析器不會讀到它,因為它不是格式正確的XML 所有屬性值都必須用單引號或雙引號引起來。

要使解析器讀取它,您會發現必須使用相關的庫對它進行整理/凈化/修復。

試試NekoHTML( http://nekohtml.sourceforge.net/usage.html

例如

package sample;

import org.apache.xerces.parsers.AbstractSAXParser;
import org.cyberneko.html.HTMLConfiguration;

public class HTMLSAXParser extends AbstractSAXParser {
    public HTMLSAXParser() {
        super(new HTMLConfiguration());
    }
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM