[英]Special characters in xml encoding using dom and java?
我有一些代碼可以將 Excel 文件轉換為 XML 文件,但是當單元格的文本包含一些特殊字符時,我無法正確處理。 例如:一個單元格包含如下文本
(Destinataire de flux entrants ou Origine de flux sortants) **==>** trallla
將其轉換為 xml 時,我得到
(Destinataire de flux entrants ou Origine de flux sortants) **==>** trallla
我怎樣才能解決這個問題?
您不希望 '>' 成為 xml 標記中值的一部分,因為它是表示標記結束的字符。 如果它被自動替換為 > ,那就很高興了。 否則,您的 XML 將無法使用。 通常,之后對 XML 的任何解析都會知道如何處理 > 部分並重新替換它。
您也可以使用CDATA 。 如果這可以幫助您解決問題。
如果您在閱讀轉義的 HTML 字符時遇到問題,您可以使用Apache 公共語言庫,其中包含方法StringEscapeUtils.html.unescapeH .
未轉義的字符串是您想要的輸入。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.