獲取第一個節點的節點值

Question

我有以下 XML：

<?xml version='1.0' ?>
<foo>A&gt;B</foo>

並且只想將開始標記的節點值獲取為A>B ，如果我們使用 getNodeValue ，它會將其轉換為不需要的 A>B 。

因此我決定使用 Transformer

        Document doc = getParsedDoc(abovexml);
        TransformerFactory tranFact = TransformerFactory.newInstance();
        Transformer transfor = tranFact.newTransformer();
        transfor.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
        Source src = new DOMSource(node);
        StringWriter buffer = new StringWriter();
        Result dest = new StreamResult(buffer);
        transfor.transform(src, dest);
        String result = buffer.toString();

但這給出了以下 output 作為<foo>A>B</foo>結果的一部分

如果有人能澄清一下，如果有一種方法可以讓我們在不從上述 output ( <foo>A>B</foo> ) 中進行字符串操作的情況下獲得A>B將很有幫助

Answer 1

由於 getNodeValue() 會自動解碼字符串。
您可以使用 Apache Commons Lang 中的 StringEscapeUtils 再次對其進行編碼。

http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/StringEscapeUtils.html
http://commons.apache.org/lang/

String nodeValue = StringEscapeUtils.escapeHtml(getNodeValue());

這會將其編碼為您希望它采用的格式。它對性能不是很友好，因為您正在為每個節點值應用編碼。

Answer 2

實際上 getNodeValue() 不是“轉換”字符串。 當從文件中解析 XML 或通過轉換生成時，得到的信息 model 是字符串是A>B ，而不是A>B 。 后者只是一種序列化形式。

另一種合法的序列化形式是A>B （因為在大多數情況下不需要轉義右尖括號）。 但是，想要生產A>B可能存在兼容性原因，特別是如果您的 output 打算成為 HTML （盡管您沒有提到）。

如果您對 escaping 有充分的理由> ，那么我同意@kensen john 的回答。

獲取第一個節點的節點值

問題描述

2 個解決方案

解決方案1
0 已采納 2011-06-03 18:46:00

解決方案2
0 2012-02-15 16:10:32

獲取第一個節點的節點值

問題描述

2 個解決方案

解決方案1 0 已采納 2011-06-03 18:46:00

解決方案2 0 2012-02-15 16:10:32

解決方案1
0 已采納 2011-06-03 18:46:00

解決方案2
0 2012-02-15 16:10:32