繁体   English   中英

Java使用正确的unicode字符将ISO-8859-1转换为UTF-8

[英]Java convert ISO-8859-1 to UTF-8 with correct unicode characters

我有一些ISO-8859-1文本,我试图转换为UTF-8但最终得到一些未正确映射的字符。 我一直在使用过多的标准内置Java字符集转换,它们基于Charset.decode和内置的CharsetDecoder。

这导致两个问题:

  • 我有一些在ISO中看起来很好的字符,但是因为我输出的是UTF-8,就像大多数java应用程序一样。
  • 即使设置为UTF-8, 我也无法插入MySQL

对于MySQL,我得到了异常(参见上面的链接):

引起:java.sql.SQLException:字符串值不正确:'\\ xC2 \\ x9Esk \\ xC3 \\ xA9 ...'为第1行的列'b'

是否有比内置的Java iconv或更好的字符解码器/映射器?

你确定你有ISO-8859-1吗? 你可能有一些Win-1252,除了十几个字符外,它可以排序很近。 那个\\ x9E引起了我的怀疑。

尝试将您的来源标记为WIN-1252,它应该正确转换。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM