[英]How Java Convert latin to UTF-8 perfect?
当我尝试通过Java将latin1字符串转换为utf8时,发生了某些错误。 如下代码:
byte[] latin2 = "¦ñ¨ãÓñ²½ìá".getBytes("ISO-8859-1");
byte[] latin1 = "¦á¨ãÓñ²½ìá".getBytes("ISO-8859-1");
byte[] utf8 = new String(latin1, "GB2312").getBytes("GB2312");
byte[] utf81 = new String(latin2, "GB2312").getBytes("GB2312");
System.out.println(new String(utf8,"GB2312"));
System.out.println(new String(utf81,"GB2312"));
输出是
?ㄣ玉步灬
?ㄣ玉步灬
因此,我对此感到困惑,如何才能将latin1精确转换为utf8?
DB字段是:
`name` char(20) CHARACTER SET latin1 COLLATE latin1_bin NOT NULL,
新的String(bytes,charset)调用中的第二个参数是设置用于解码字节数组的字符集(来自Javadoc:“ charset用于解码字节的字符集”)...因此,在您的情况下,应该设置为用于编码字节的编码 :“ ISO-8859-1”:
new String(latin1, "ISO-8859-1").getBytes("GB2312");
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.