繁体   English   中英

匕首输出Java(char)134不起作用cp1252

[英]dagger output java (char)134 doesnt work cp1252

通常,我的程序应将所有CP1252代码以char形式输出:

System.out.println("actual file.encoding: "+System.getProperty("file.encoding")); // CP1252


for (int i = 0; i < 500; i++) {
    System.out.println("Nr.: "+i+ " Symbol: "+(char)i");
}

但是输出是:(整个输出的片段!)

Nr.: 124 Symbol: |
Nr.: 125 Symbol: }
Nr.: 126 Symbol: ~
Nr.: 127 Symbol: 
Nr.: 128 Symbol: ?
Nr.: 129 Symbol: ?
Nr.: 130 Symbol: ?
Nr.: 131 Symbol: ?
Nr.: 132 Symbol: ?
Nr.: 133 Symbol: ?
Nr.: 134 Symbol: ?
Nr.: 135 Symbol: ?

但是在https://en.wikipedia.org/wiki/Windows-1252中 ,写成134是:†

为什么不显示†?

CP1252中的字节值134(或0x86)确实是匕首,但Java中的char始终为UTF-16(Unicode),而在UTF-16中, char始终为非图形字符U + 0080-U + 00FF(整数代码点128-159)而U + 2020是与CP1252字节0x86对应的字符。

使用System.out.write(/*int 0-255 only*/i)输出已编码的byte 或者在这种情况下不太方便,但在其他情况下更可取,请将字节放入数组byte[]并使用System.out.write(byte[])

啊,现在可以用了...有人知道这里涉及哪些字符集吗? 我稍后会发现,但现在却令人困惑。 谢谢:它适用于Unicode U + 2020(十六进制),它对应于8224:

fW.write("Omg it writes † : ");
        fW.write(13);
        fW.write(10);
        fW.write(0x2020);
        fW.write(8224);
        fW.write(13);
        fW.write(10);

输出:

    Begin:
Omg it writes † : 
††

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM