簡體   English   中英

轉義XML中的特殊字符/符號?

[英]Escape special characters/Symbols in XML?

在使用數據庫中的表創建XML時,我得到了許多特殊字符,例如注冊商標,商標,程度,不同的標點符號等(這些以符號形式,十六進制,名稱代碼,數字代碼顯示)...。 其他一些字詞,例如°,...

在我的XML中,某些字符也顯示為x99,xEA等。

是否存在使用Java代碼創建XML時可以處理所有這些的庫/ API。 我為XML使用“ UTF-8”字符編碼。

另外,由於它是生產數據,因此我無法清理數據庫以獲取一致的數據。

一種可能的選擇是將您的數據包含在CDATA標記中,這會將數據標記為可能包含標記的字符數據,但不應這樣處理。

有一個免費的命令行工具 ,可將文本中帶有特殊字符的文件轉換為有效的XML。 它還可以確保文件編碼與聲明中指定的編碼匹配。

還有一個Java開發人員套件,允許您使用解析器來解析此類文件(稱為XPL),以替代XML或對XML進行預處理。 它使用類似於StAX的進程稱為StAX-PL。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM