繁体   English   中英

将使用Latin-1代码页编码的UTF-8转换为iso-8859-1字节

[英]Converting UTF-8 encoded with Latin-1 codepage to iso-8859-1 bytes

这是漫长的一天。 我不确定我是在俯视什么,还是没有简单的答案可以解决我的问题。

这是我的方案:

  • 我正在将文本数据作为字节发送到不支持UTF-8编码的系统。
  • 它具有自定义字符集,但我只需要与ISO-8859-1 / Latin-1编码匹配的字符。
  • 我有传入的UTF-8编码的String数据,该数据仅使用ASCII和仅来自Latin-1代码页的少量外来字符。

在尝试对这些字符串进行重新编码时,我最终都以“?”结尾 替换外来字符,第二个Unicode字节或发送两个Unicode字节。

是否有一种简单的方法来获取使用2个字节描述这些Latin-1代码页字符并将其编码为ISO-8859-1字节的传入数据?

在读者方面,您需要以下内容:

new InputStreamReader(underlyingInputStream, "UTF-8")

在作者方面:

new OutputStreamWriter(underlyingOutputStream, "ISO-8859-1")

然后,您应该能够读取传入的UTF-8编码字符,并将其写为ISO-8859-1编码字符。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM