[英]parsing a XML file in java
我已经写了一个SAX解析器。 当attibute值嵌套在双引号中时,它可以正常工作。 但是,如果我不使用引号,则会引发异常。 我希望解析器解析其属性值不在引号内的XML文件。 我想解析以下文件类型:
<root>
<tag1 attribute1=value1 > my data </tag1>
</root>
请注意,value1不在引号内
我可以让我的解析器解析以上文件吗? 如果是,怎么办?
SAX解析器不会读到它,因为它不是格式正确的XML 。 所有属性值都必须用单引号或双引号引起来。
要使解析器读取它,您会发现必须使用相关的库对它进行整理/净化/修复。
试试NekoHTML( http://nekohtml.sourceforge.net/usage.html )
例如
package sample;
import org.apache.xerces.parsers.AbstractSAXParser;
import org.cyberneko.html.HTMLConfiguration;
public class HTMLSAXParser extends AbstractSAXParser {
public HTMLSAXParser() {
super(new HTMLConfiguration());
}
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.