簡體   English   中英

在JAVA中向/從文件寫/讀可變字節編碼的字符串表示

[英]write/read variable byte encoded string representation to/from file in JAVA

大家! 我最近了解了可變字節編碼。 例如,如果一個文件包含這個數字序列:824 5 214577應用可變字節編碼,這個序列將編碼為000001101011100010000101000011010000110010110001。現在我想知道如何在另一個文件中寫入,以便從中生成一種壓縮文件原版的。 同樣如何閱讀它。 我正在使用JAVA。

試過這個:

LinkedList<Integer> numbers = new LinkedList<Integer>();
numbers.add(824);
numbers.add(5);
numbers.add(214577);
String code = VBEncoder.encodeToString(numbers);//returns 000001101011100010000101000011010000110010110001 into code
File file = new File("test.compressed");
DataOutputStream out = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(file)));
out.writeBytes(code);
out.flush();

這只是將二進制表示寫入文件......這不是我所期待的。

我也試過這個:

LinkedList<Integer> code = VBEncoder.encode(numbers);//returns linked list of Byte(i give its describtion later)
File file = new File("test.compressed");
DataOutputStream out = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(file)));

for(Byte b:code){
        out.write(b.toInt());
        System.out.println(b.toInt());
}
out.flush();
// he goes the describtion of the class Byte
class Byte {
    int[] abyte;
    Byte() {
        abyte = new int[8];
    }
    public void readInt(int n) {
        String bin = Integer.toBinaryString(n);

        for (int i = 0; i < (8 - bin.length()); i++) {
            abyte[i] = 0;
        }
        for (int i = 0; i < bin.length(); i++) {
            abyte[i + (8 - bin.length())] = bin.charAt(i) - 48; 
        }
    }

    public void switchFirst() {
        abyte[0] = 1;
    }

    public int toInt() {
        int res = 0;
        for (int i = 0; i < 8; i++) {
            res += abyte[i] * Math.pow(2, (7 - i));
        }
        return res;
    }

    public static Byte fromString(String codestring) {
        Byte b = new Byte(); 
        for(int i=0; i < 8; i++)
            b.abyte[i] = (codestring.charAt(i)=='0')?0:1;
        return b;
    }

    public String toString() {
        String res = "";
        for (int i = 0; i < 8; i++) {
            res += abyte[i];
        }
        return res;
    }
}

它在控制台中打印出來:

6
184
133
13
12
177

第二次嘗試似乎有效...輸出文件大小為6字節,而第一次嘗試則為48字節。 但第二次嘗試的問題是我無法成功讀回文件。

InputStreamReader inStream = new InputStreamReader(new FileInputStream(file));

        int c = -1;
        while((c = inStream.read()) != -1){
            System.out.println( c );
        }

我明白了:

6
184
8230
13
12
177

也許我的做法是錯誤的:希望得到你的一些好建議。 謝謝!

它解決了; 我只是沒有以正確的方式閱讀文件:下面是正確的方法:

DataInputStream inStream = null; 
inStream = new DataInputStream(new BufferedInputStream(newFileInputStream(file)));

int c = -1;
while((c = inStream.read()) != -1){
    Byte b = new Byte();
    b.readInt(c);
    System.out.println( c +":" + b.toString());
}

現在我得到了這個結果:

6:00000110
184:10111000
133:10000101
13:00001101
12:00001100
177:10110001

現在,將原始整數序列寫入可變編碼字節的重要性減小了文件的大小; 如果我們通常在文件中寫入這個整數序列,它的大小將是12個字節(3 * 4個字節)。 但現在只有6個字節。

int c = -1;
LinkedList<Byte> bytestream = new LinkedList<Byte>();
while((c = inStream.read()) != -1){
    Byte b = new Byte();
    b.readInt(c);
    bytestream.add(b);
}
LinkedList<Integer> numbers = VBEncoder.decode(bytestream);
for(Integer number:numbers) System.out.println(number);
//
//here goes the code of VBEncoder.decode
public static LinkedList<Integer> decode(LinkedList<Byte> code) {
    LinkedList<Integer> numbers = new LinkedList<Integer>();
    int n = 0;
    for (int i = 0; !(code.isEmpty()); i++) {
        Byte b = code.poll(); 
        int bi = b.toInt(); 
        if (bi < 128) {
            n = 128 * n + bi;
        } else { 
            n = 128 * n + (bi - 128);
            numbers.add(n); 
            n = 0; 
        }
    }
    return numbers;
}

我回到了序列:

824
5
214577

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM