用Java解析XML文件

Question

我已经写了一个SAX解析器。 当attibute值嵌套在双引号中时，它可以正常工作。 但是，如果我不使用引号，则会引发异常。 我希望解析器解析其属性值不在引号内的XML文件。 我想解析以下文件类型：

<root>
    <tag1 attribute1=value1 > my data  </tag1>
</root>

请注意，value1不在引号内

我可以让我的解析器解析以上文件吗？ 如果是，怎么办？

Answer 1

SAX解析器不会读到它，因为它不是格式正确的XML 。 所有属性值都必须用单引号或双引号引起来。

要使解析器读取它，您会发现必须使用相关的库对它进行整理/净化/修复。

Answer 2

试试NekoHTML（ http://nekohtml.sourceforge.net/usage.html ）

例如

package sample;

import org.apache.xerces.parsers.AbstractSAXParser;
import org.cyberneko.html.HTMLConfiguration;

public class HTMLSAXParser extends AbstractSAXParser {
    public HTMLSAXParser() {
        super(new HTMLConfiguration());
    }
}

用Java解析XML文件

问题描述

2 个解决方案

解决方案1
6 2009-09-06 05:46:59

解决方案2
0 2009-09-06 05:52:04

用Java解析XML文件

问题描述

2 个解决方案

解决方案1 6 2009-09-06 05:46:59

解决方案2 0 2009-09-06 05:52:04

解决方案1
6 2009-09-06 05:46:59

解决方案2
0 2009-09-06 05:52:04