用Java解析XML文件

Question

我已經寫了一個SAX解析器。 當attibute值嵌套在雙引號中時，它可以正常工作。 但是，如果我不使用引號，則會引發異常。 我希望解析器解析其屬性值不在引號內的XML文件。 我想解析以下文件類型：

<root>
    <tag1 attribute1=value1 > my data  </tag1>
</root>

請注意，value1不在引號內

我可以讓我的解析器解析以上文件嗎？ 如果是，怎么辦？

Answer 1

SAX解析器不會讀到它，因為它不是格式正確的XML 。 所有屬性值都必須用單引號或雙引號引起來。

要使解析器讀取它，您會發現必須使用相關的庫對它進行整理/凈化/修復。

Answer 2

試試NekoHTML（ http://nekohtml.sourceforge.net/usage.html ）

例如

package sample;

import org.apache.xerces.parsers.AbstractSAXParser;
import org.cyberneko.html.HTMLConfiguration;

public class HTMLSAXParser extends AbstractSAXParser {
    public HTMLSAXParser() {
        super(new HTMLConfiguration());
    }
}

用Java解析XML文件

問題描述

2 個解決方案

解決方案1
6 2009-09-06 05:46:59

解決方案2
0 2009-09-06 05:52:04

用Java解析XML文件

問題描述

2 個解決方案

解決方案1 6 2009-09-06 05:46:59

解決方案2 0 2009-09-06 05:52:04

解決方案1
6 2009-09-06 05:46:59

解決方案2
0 2009-09-06 05:52:04