簡體   English   中英

將使用Latin-1代碼頁編碼的UTF-8轉換為iso-8859-1字節

[英]Converting UTF-8 encoded with Latin-1 codepage to iso-8859-1 bytes

這是漫長的一天。 我不確定我是在俯視什么,還是沒有簡單的答案可以解決我的問題。

這是我的方案:

  • 我正在將文本數據作為字節發送到不支持UTF-8編碼的系統。
  • 它具有自定義字符集,但我只需要與ISO-8859-1 / Latin-1編碼匹配的字符。
  • 我有傳入的UTF-8編碼的String數據,該數據僅使用ASCII和僅來自Latin-1代碼頁的少量外來字符。

在嘗試對這些字符串進行重新編碼時,我最終都以“?”結尾 替換外來字符,第二個Unicode字節或發送兩個Unicode字節。

是否有一種簡單的方法來獲取使用2個字節描述這些Latin-1代碼頁字符並將其編碼為ISO-8859-1字節的傳入數據?

在讀者方面,您需要以下內容:

new InputStreamReader(underlyingInputStream, "UTF-8")

在作者方面:

new OutputStreamWriter(underlyingOutputStream, "ISO-8859-1")

然后,您應該能夠讀取傳入的UTF-8編碼字符,並將其寫為ISO-8859-1編碼字符。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM