为什么使用UTF-16编码会得到一个奇怪的字节序列？

Question

byte[] byt = "君".getBytes(StandardCharsets.UTF_8);
for (byte b : byt) {
    System.out.println(Integer.toBinaryString(b));
}

Output: 输出：

11111111111111111111111111100101
11111111111111111111111110010000
11111111111111111111111110011011

This is right. 这是对的。

But: 但：

byte[] byt = "君".getBytes(StandardCharsets.UTF_16);
for (byte b : byt) {
    System.out.println(Integer.toBinaryString(b));
}

Output: 输出：

11111111111111111111111111111110
11111111111111111111111111111111
1010100
11011

君's hexadecimal code is 101010000011011 君的十六进制代码是101010000011011

So: 所以：

11111111111111111111111111111110
11111111111111111111111111111111

What is this? 这是什么？

Answer 1

The first to bytes 0xFEFF or 第一个到字节0xFEFF或

11111111111111111111111111111110
11111111111111111111111111111111

are Byte Order Mark - they tell if the rest is encoded using Big Endian or Little Endian. 是字节顺序标记-告诉他们其余部分是使用Big Endian还是Little Endian编码的。

If you don't wan't them you can set the encoding explicitly - use StandardCharsets.UTF_16LE or StandardCharsets.UTF_16BE 如果不需要，则可以显式设置编码-使用StandardCharsets.UTF_16LE或StandardCharsets.UTF_16BE

为什么使用UTF-16编码会得到一个奇怪的字节序列？

问题描述

1 个解决方案

解决方案1
3 已采纳 2019-03-27 12:52:59

为什么使用UTF-16编码会得到一个奇怪的字节序列？

问题描述

1 个解决方案

解决方案1 3 已采纳 2019-03-27 12:52:59

解决方案1
3 已采纳 2019-03-27 12:52:59