繁体   English   中英

具有特殊字符的xml,编码为u​​tf-8

[英]xml with special character, encoding utf-8

我有几个简单的问题,因为我在阅读所有差异回答时感到困惑。

1)如果我有一个带有序言的xml: <?xml version="1.0" encoding="utf-8" ?> ,我将用Java解组(例如:JaXB)。 我想我不能在里面放CROSS OF LORRAINE( http://www.fileformat.info/info/unicode/char/2628/index.htm ),但是可以放“ \\ u2628”,对吗?

2)我还听说过UTF-8不包含它,但是Unicode中的任何内容都可以使用UTF-8(或UTF-16)编码保存,这是此页面上的示例:

UTF-8(十六进制)0xE2 0x98 0xA8(e298a8)

我的推理正确吗? 我可以使用此表单并将其以utf-8编码格式放入xml吗?

如果您的序言为xml指定utf-8编码:

<?xml version="1.0" encoding="utf-8" ?>

那么您可以直接使用utf-8字符,也可以将它们编码为&#9768;

绝对没问题-UTF-8可以编码任何Unicode字符。

XML对控制字符有一些限制(U + 0000到U + 001F),但是U + 2628应该可以。

(就我个人而言,我更喜欢去unicode.org以获得最终的代码表,但是U + 2628肯定出现在这里 。)

您不必担心UTF-8方面的问题-您应该能够直接将字符放入数据中,并让JAXB进行编码。

另外1个...

仅在序言中指定编码是不够的。 您需要确保使用正确的编码对内容进行序列化。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM