[英]How to parse String as Binary and convert it to UTF-8 equivalent in Java?
我需要将String内容解析为二进制序列,并将其转换为等效于UTF-8的 String。
例如, B , A和R的 UTF-8二进制等效项如下:
B = 01000010
A = 01000001
R = 01010010
现在,我需要将字符串“ 010000100100000101010010”转换为字符串“ BAR”
即对于具有24个字符上述情况下输入字符串被分成三个相等的部分(每部分8字符)和翻译到其UTF-8当量为字符串值。
样例代码:
public static void main(String args[]) {
String B = "01000010";
String A = "01000001";
String R = "01010010";
String BAR = "010000100100000101010010";
String utfEquiv = toUTF8(BAR);//expecting to get "BAR"
System.out.println(utfEquiv);
}
private static String toUTF8(String str) {
// TODO
return "";
}
toUTF8(String str){}方法的实现应该是什么
您应该将其分为两个问题:
后者非常简单,使用new String(bytes, StandardCharsets.UTF_8)
。
对于第一部分,棘手的部分是Byte.parseByte
不会自动处理前导1 ...因此,我可能会将每个8位字符串解析为一个short
字符串,然后转换为byte
:
public static byte[] binaryToBytes(String input) {
// TODO: Argument validation (nullity, length)
byte[] ret = new byte[input.length() / 8];
for (int i = 0; i < ret.length; i++) {
String chunk = input.substring(i * 8, i * 8 + 8);
ret[i] = (byte) Short.parseShort(chunk, 2);
}
return ret;
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.