簡體   English   中英

如何將String解析為Binary並將其轉換為Java中等效的UTF-8?

[英]How to parse String as Binary and convert it to UTF-8 equivalent in Java?

我需要將String內容解析為二進制序列,並將其轉換為等效於UTF-8的 String。

例如, BAR的 UTF-8二進制等效項如下:
B = 01000010
A = 01000001
R = 01010010


現在,我需要將字符串“ 010000100100000101010010”轉換為字符串“ BAR”
對於具有24個字符上述情況下輸入字符串被分成三個相等的部分(每部分8字符)和翻譯到其UTF-8當量為字符串值。

樣例代碼:

public static void main(String args[]) {
    String B = "01000010";
    String A = "01000001";
    String R = "01010010";
    String BAR = "010000100100000101010010";

    String utfEquiv = toUTF8(BAR);//expecting to get "BAR"
    System.out.println(utfEquiv);
}

private static String toUTF8(String str) {
    // TODO 
    return "";
}

toUTF8(String str){}方法的實現應該是什么

您應該將其分為兩個問題:

  • 通過解析二進制值將字符串轉換為字節數組
  • 使用UTF-8將字節數組轉換回字符串

后者非常簡單,使用new String(bytes, StandardCharsets.UTF_8)

對於第一部分,棘手的部分是Byte.parseByte不會自動處理前導1 ...因此,我可能會將每個8位字符串解析為一個short字符串,然后轉換為byte

public static byte[] binaryToBytes(String input) {
    // TODO: Argument validation (nullity, length)
    byte[] ret = new byte[input.length() / 8];
    for (int i = 0; i < ret.length; i++) {
        String chunk = input.substring(i * 8, i * 8 + 8);
        ret[i] = (byte) Short.parseShort(chunk, 2);
    }
    return ret;
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM