[英]DOMImplementationLS serialize to String in UTF-8 in Java
閱讀java org.w3c.dom.ls的文檔似乎只能將元素序列化為帶有java本機字符串編碼UTF-16的String。 但是,我需要創建一個UTF-8字符串,轉義或不存在,我知道它仍然是一個UTF-16字符串。 任何人都有想法繞過這個? 我需要將字符串傳遞給將使用String的生成的WS客戶端,然后它應該是UTF-8。
我用來創建字符串的代碼:
DOMImplementationRegistry domImplementationRegistry = DOMImplementationRegistry.
DOMImplementationLS domImplementationLS = (DOMImplementationLS) REGISTRY.getDOMImplementation("LS");
LSSerializer writer = domImplementationLS.createLSSerializer();
String result = writer.writeToString(element);
您仍然可以使用DOMImplementationLS
:
DOMImplementationRegistry domImplementationRegistry = DOMImplementationRegistry.
DOMImplementationLS domImplementationLS = (DOMImplementationLS)REGISTRY.getDOMImplementation("LS");
LSOutput lsOutput = domImplementationLS.createLSOutput();
lsOutput.setEncoding("UTF-8");
Writer stringWriter = new StringWriter();
lsOutput.setCharacterStream(stringWriter);
lsSerializer.write(doc, lsOutput);
String result = stringWriter.toString();
我發現將DOM序列化為String的最靈活方法是使用javax.xml.transform
API:
Node node = ...
StringWriter output = new StringWriter();
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.transform(new DOMSource(node), new StreamResult(output));
String xml = output.toString();
它不是特別優雅,但它可以讓你更好地控制輸出編碼。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.