簡體   English   中英

xml編碼中的特殊字符使用dom和java?

[英]Special characters in xml encoding using dom and java?

我有一些代碼可以將 Excel 文件轉換為 XML 文件,但是當單元格的文本包含一些特殊字符時,我無法正確處理。 例如:一個單元格包含如下文本

(Destinataire de flux entrants ou Origine de flux sortants) **==>** trallla 

將其轉換為 xml 時,我得到

(Destinataire de flux entrants ou Origine de flux sortants) **==&gt** trallla  

我怎樣才能解決這個問題?

您不希望 '>' 成為 xml 標記中值的一部分,因為它是表示標記結束的字符。 如果它被自動替換為 &gt ,那就很高興了。 否則,您的 XML 將無法使用。 通常,之后對 XML 的任何解析都會知道如何處理 &gt 部分並重新替換它。

您也可以使用CDATA 如果這可以幫助您解決問題。

如果您在閱讀轉義的 HTML 字符時遇到問題,您可以使用Apache 公共語言庫,其中包含方法StringEscapeUtils.html.unescapeH .

未轉義的字符串是您想要的輸入。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM