[英]Escape special characters/Symbols in XML?
在使用數據庫中的表創建XML時,我得到了許多特殊字符,例如注冊商標,商標,程度,不同的標點符號等(這些以符號形式,十六進制,名稱代碼,數字代碼顯示)...。 其他一些字詞,例如°,...
在我的XML中,某些字符也顯示為x99,xEA等。
是否存在使用Java代碼創建XML時可以處理所有這些的庫/ API。 我為XML使用“ UTF-8”字符編碼。
另外,由於它是生產數據,因此我無法清理數據庫以獲取一致的數據。
一種可能的選擇是將您的數據包含在CDATA標記中,這會將數據標記為可能包含標記的字符數據,但不應這樣處理。
有一個免費的命令行工具 ,可將文本中帶有特殊字符的文件轉換為有效的XML。 它還可以確保文件編碼與聲明中指定的編碼匹配。
還有一個Java開發人員套件,允許您使用解析器來解析此類文件(稱為XPL),以替代XML或對XML進行預處理。 它使用類似於StAX的進程稱為StAX-PL。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.