簡體   English   中英

DOMImplementationLS在Java中以UTF-8序列化為String

[英]DOMImplementationLS serialize to String in UTF-8 in Java

閱讀java org.w3c.dom.ls的文檔似乎只能將元素序列化為帶有java本機字符串編碼UTF-16的String。 但是,我需要創建一個UTF-8字符串,轉義或不存在,我知道它仍然是一個UTF-16字符串。 任何人都有想法繞過這個? 我需要將字符串傳遞給將使用String的生成的WS客戶端,然后它應該是UTF-8。

我用來創建字符串的代碼:

DOMImplementationRegistry domImplementationRegistry = DOMImplementationRegistry.
DOMImplementationLS domImplementationLS = (DOMImplementationLS) REGISTRY.getDOMImplementation("LS");
LSSerializer writer = domImplementationLS.createLSSerializer();
String result = writer.writeToString(element);

您仍然可以使用DOMImplementationLS

DOMImplementationRegistry domImplementationRegistry = DOMImplementationRegistry.
DOMImplementationLS domImplementationLS = (DOMImplementationLS)REGISTRY.getDOMImplementation("LS");
LSOutput lsOutput =  domImplementationLS.createLSOutput();
lsOutput.setEncoding("UTF-8");
Writer stringWriter = new StringWriter();
lsOutput.setCharacterStream(stringWriter);
lsSerializer.write(doc, lsOutput);     
String result = stringWriter.toString();

我發現將DOM序列化為String的最靈活方法是使用javax.xml.transform API:

    Node node = ...
    StringWriter output = new StringWriter();

    Transformer transformer = TransformerFactory.newInstance().newTransformer();
    transformer.transform(new DOMSource(node), new StreamResult(output));

    String xml = output.toString();

它不是特別優雅,但它可以讓你更好地控制輸出編碼。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM