Java与Objective-c UTF-8编码

Question

我需要将Java代码转换为Objective-C，但我陷入了字符串到字节数组转换的困境。

在Java中，我有：

String Key="1234567890";
byte[] xKey = Key.getBytes();
System.out.println(Arrays.toString(xKey));

它打印：

[49, 50, 51, 52, 53, 54, 55, 56, 57, 48]

在Objective-C中，我有：

NSString *Key = @"1234567890";
(1) NSData * xKey = [key dataUsingEncoding:NSUTF8StringEncoding];
(2) NSLog(@"%@", xKey);

它打印：

<31323334 3536373839 30>

在（1）中，我使用了：

const char * xKey = [Key UTF8String];

在（2）中，我使用了：

NSLog(@"%@s", xKey);

在UTF-8中，48对应于0。

Answer 1

String "1234567890"的正确UTF-8编码形式只是其字符的代码，因为所有字符均使用1字节编码（它们的代码小于127）：

[49, 50, 51, 52, 53, 54, 55, 56, 57, 48]

注意： Arrays.toString(byte[])使用Arrays.toString(byte[])的十进制表示形式来构造数组的String表示形式。

如果仔细观察，则Objective-c结果完全相同 ，只是以十六进制基数打印：

<31323334 3536373839 30>

0x31 = 49
0x32 = 50
...
0x30 = 48

通过String.getBytes String.getBytes()从javadoc退出：

使用平台的默认字符集将此String编码为字节序列，并将结果存储到新的字节数组中。

因此，使用平台的默认编码，因此结果可能会因平台而异，因此始终建议您声明要使用哪种编码，例如：

byte[] xKey = Key.getBytes(StandardCharsets.UTF_8);

Answer 2

采用：

byte[] xKey = Key.getBytes(StandardCharsets.UTF_8);