繁体   English   中英

通过 DOM 解析器处理来自 XML 的 CDATA

[英]Processing CDATA from XML via DOM parser

我以前从未处理过 XML,所以我不确定如何在 XML 文件中处理 CDATA。 我迷失在节点、父节点、子节点、nList 等中。

谁能从这些代码片段中告诉我我的问题是什么?

我的getTagValue()方法适用于除“Details”之外的所有标签,“Details”是包含 CDATA 的标签。

.....
NodeList nList = doc.getElementsByTagName("Assignment");
for (int temp = 0; temp < nList.getLength(); temp++) {
    Node nNode = nList.item(temp);
    if (nNode.getNodeType() == Node.ELEMENT_NODE) {
        Element eElement = (Element) nNode;
        results = ("Class : " + getTagValue("ClassName", eElement)) + 
                  ("Period : " + getTagValue("Period", eElement)) +
                  ("Assignment : " + getTagValue("Details", eElement));
        myAssignments.add(results);
    }
}
.....
private String getTagValue(String sTag, Element eElement) {
    NodeList nlList = eElement.getElementsByTagName(sTag).item(0).getChildNodes();

    Node nValue = (Node) nlList.item(0);
    if((CharacterData)nValue instanceof CharacterData)
    {
        return ((CharacterData) nValue).getData();
    }
    return nValue.getNodeValue();
}

我怀疑您的问题出在getTagValue方法的以下代码行中:

Node nValue = (Node) nlList.item(0);

你总是第一个孩子。 但你可能有不止一个。

以下示例有 3 个子节点:文本节点“detail”、CDATA 节点“with cdata”和文本节点“here”:

<Details>detail <![CDATA[with cdata]]> here</Details>

如果你运行你的代码,你只得到“细节”,你失去了 rest。

以下示例有 1 个子节点:CDATA 节点“此处有 cdata 的详细信息”:

<Details><![CDATA[detail with cdata here]]></Details>

如果你运行你的代码,你会得到一切。

但是和上面一样的例子是这样写的:

<Details>
   <![CDATA[detail with cdata here]]>
</Details>

现在有 3 个孩子,因为空格和换行被拾取为文本节点。 如果你运行你的代码,你会得到第一个带有换行符的空文本节点,你会丢失 rest。

您要么必须遍历所有子项(无论有多少)并连接每个子项的值以获得完整结果,要么如果区分纯文本和 CDATA 中的文本对您来说并不重要, coalescing在首先是文档生成器工厂:

DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
docFactory.setCoalescing(true);
...

合并指定此代码生成的解析器会将 CDATA 节点转换为文本节点,并将 append 转换为相邻的(如果有)文本节点。 默认情况下,此值设置为 false。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM