[英]How to encode characters from Oracle to XML?
在我的環境中,我使用Java將結果集序列化為XML。 它基本上是這樣的:
//foreach column of each row
xmlHandler.startElement(uri, lname, "column", attributes);
String chars = rs.getString(i);
xmlHandler.characters(chars.toCharArray(), 0, chars.length());
xmlHandler.endElement(uri, lname, "column");
在Firefox中,XML看起來像這樣:
<row num="69004">
<column num="1">10069</column>
<column num="2">sd</column>
<column num="3">FCVolume </column>
</row>
但是當我解析XML時,我得到了a
org.xml.sax.SAXParseException:字符引用“ &#26 ”是無效的XML字符。
我現在的問題是:我必須替換哪些字符,或者如何編碼我的字符,它們將是有效的XML?
我在Xml規范中找到了一個有趣的列表:根據該列表,它不鼓勵使用字符#26(十六進制: #x1A )。
還不鼓勵在以下范圍中定義的字符。 它們是控制字符或永久未定義的Unicode字符
查看完整的范圍 。
此代碼從String中替換所有無效的Xml Utf8:
public String stripNonValidXMLCharacters(String in) {
StringBuffer out = new StringBuffer(); // Used to hold the output.
char current; // Used to reference the current character.
if (in == null || ("".equals(in))) return ""; // vacancy test.
for (int i = 0; i < in.length(); i++) {
current = in.charAt(i);
if ((current == 0x9) ||
(current == 0xA) ||
(current == 0xD) ||
((current >= 0x20) && (current <= 0xD7FF)) ||
((current >= 0xE000) && (current <= 0xFFFD)) ||
((current >= 0x10000) && (current <= 0x10FFFF)))
out.append(current);
}
return out.toString();
}
它取自無效的XML字符:當有效的UTF8不代表有效的XML時
但有了這個,我還有UTF-8的比較問題:
org.xml.sax.SAXParseException: Invalid byte 1 of 1-byte UTF-8 sequence
在閱讀XML之后 - 從servlet返回XML作為UTF-8我剛嘗試了如果我將Contenttype設置為這樣會發生什么:
response.setContentType("text/xml;charset=utf-8");
它工作....
&符號(&)和左尖括號(<)不得以其文字形式出現,除非用作標記分隔符,或用於注釋,處理指令或CDATA部分。 如果在其他地方需要它們,則必須使用數字字符引用或字符串“&”和“<”分別進行轉義。 右尖括號(>)可以使用字符串“>”表示,並且為了兼容性,當它出現在字符串“]]>”內容中時,必須使用“>”或字符引用進行轉義。 string不標記CDATA部分的結尾。
如果您使用CDATA,則可以跳過編碼:
<column num="1"><![CDATA[10069]]></column>
<column num="2"><![CDATA[sd&]]></column>
你在運行哪個版本的JRE? Sax Project說:
J2SE 1.4捆綁了舊版本的SAX2。 如何使SAX2 r2或更高版本可用?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.