Java中的等效GetBytes函数，例如c＃

Question

将C＃库移植到Java中时，我在将字符串转换为字节时遇到问题。 它转换字符串，但不是相同的字节数组。

我在C＃中使用此代码

string input = "Test ěščřžýáíé 1234";
Encoding encoding = Encoding.UTF8;
byte[] data = encoding.GetBytes(input);

和Java代码

String input = "Test ěščřžýáíé 1234";
String encoding = "UTF8";
byte[] data = input.getBytes(encoding);

第一种是Java输出，右一种是C＃如何使Java输出与C＃相同？

在此处输入图片说明

Answer 1

字节数组可能是相同的。 但是，如果将它们格式化为字符串表示形式（例如，通过调试器查看），则它们会出现不同的情况，因为在C＃中byte数据类型被视为未签名（具有值0 – 255 ），但是在Java中已签名（值-128 – 127 ）。 请参阅此问题和我的答案以获取解释。

编辑：基于此答案，您可以使用以下命令在Java中打印无符号值：

byte b = -60;
System.out.println((short)(b & 0xFF));   // output: 196

Answer 2

这些数组很可能是相同的。

您会被C＃和Java之间的巨大差异所折服：在Java中， byte是unsigned 。

为了转储，请尝试此：

public void dumpBytesToStdout(final byte[] array)
{
    for (final byte b: array)
        System.out.printf("%02X\n", b);
}

并在C＃中执行等效的转储方法（不知道如何，我不执行C＃）

或者，如果转储函数涉及大于字节的整数类型（例如int），请执行以下操作：

i & 0xff

删除符号位。 请注意，如果强制转换字节-1，则其内容为：

1111 1111

到一个int，这不会给：

0000 0000 0000 0000 0000 0000 1111 1111

但：

1111 1111 1111 1111 1111 1111 1111 1111

即符号位是“ carry”（否则，强制转换将产生int值255，而不是-1）

Java中的等效GetBytes函数，例如c＃

问题描述

2 个解决方案

解决方案1
3 已采纳 2014-02-27 12:19:45

解决方案2
2 2014-02-27 12:27:02

Java中的等效GetBytes函数，例如c＃

问题描述

2 个解决方案

解决方案1 3 已采纳 2014-02-27 12:19:45

解决方案2 2 2014-02-27 12:27:02

解决方案1
3 已采纳 2014-02-27 12:19:45

解决方案2
2 2014-02-27 12:27:02