簡體   English   中英

Java:SAXParser字符參考解碼

[英]Java: SAXParser character reference decoding

參考此問題Java:使用SAXParser拆分大型XML文件我實際上是在使用SAXParser讀取xml文件並將其回顯到另一個文件。

我的問題是輸入文件的內容包含字符引用,這些字符引用在讀入時將被解碼。如何停止此操作? 我想寫出原始字符,而沒有解碼參考。

(我無法舉一個例子,因為它們在頁面中已解碼!)

dom4jXMLWriter類將重新編碼這些字符。 例如這段代碼:

XMLWriter writer = new XMLWriter(System.out);
writer.startElement(null, null, "example", new AttributesImpl());
writer.write(">");
writer.endElement(null, null, "example");
writer.flush();

將產生以下輸出:

<example>&gt;</example>

我認為您無法使用SAX做到這一點。 但是,您可以告訴StAX解析器(與SAX相對)在解析時不解碼字符實體( 請參見此先前的回答 )。 您應該能夠以解析器讀取它們的相同格式將它們回顯到輸出。

StAX的性能應與SAX一樣好。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM