使用STaX解析多个XML片段

Question

我希望以下内容可以在StAX中解析，

<something a="b"/>
<something a="b"/>

但是当你到达第二个元素时它就会窒息。 因为没有共同的根元素。 （我不太清楚为什么拉解析器会关心这个特定的问题......无论如何......）

我可以伪造一个根元素，例如Guava：

    InputSupplier<Reader> join = CharStreams.join(
            newReaderSupplier("<root>"),
            newReaderSupplier(new File("...")),
            newReaderSupplier("</root>"));

    XMLInputFactory xif = XMLInputFactory.newInstance();
    XMLStreamReader xsr = xif.createXMLStreamReader(join.getInput());
    xsr.nextTag();  // Skip the fake root

所以我的问题是：有没有办法避免这种黑客行为？ 一些'片段'模式，我可以把解析器放入？

Answer 1

不。 StAX API不支持片段。 XMLStreamReader仅适用于一个XML文档。 但是，你的“黑客”并没有那么糟糕......

Answer 2

Woodstox StAX实现显然支持这一点： http ：//woodstox.codehaus.org/3.2.9/javadoc/com/ctc/wstx/api/WstxInputProperties.html#P_INPUT_PARSING_MODE

碰巧我们已经在某些地方使用过Woodstox，但我没想到Google会选择特定于Woodstox的选项！

Answer 3

根据XML规范，XML文档必须具有单个根元素，否则它不能很好地形成。 所以你所谓的hack根本就不是黑客，它是修复文档的最好方法....

使用STaX解析多个XML片段

问题描述

3 个解决方案

解决方案1
2 2012-03-30 08:14:41

解决方案2
1 已采纳 2012-04-04 23:51:07

解决方案3
1 2016-04-18 23:02:14

使用STaX解析多个XML片段

问题描述

3 个解决方案

解决方案1 2 2012-03-30 08:14:41

解决方案2 1 已采纳 2012-04-04 23:51:07

解决方案3 1 2016-04-18 23:02:14

解决方案1
2 2012-03-30 08:14:41

解决方案2
1 已采纳 2012-04-04 23:51:07

解决方案3
1 2016-04-18 23:02:14