簡體   English   中英

Java函數將Windows-1252編碼為UTF-8,得到相同的符號

[英]Java functions to encode Windows-1252 to UTF-8 getting the same symbol

我是這個論壇的新手。 我在將Windows-1252編碼轉換為UTF-8時遇到問題。

我有一個用Windows-1252編碼的字符串(例如字符:¢)。 我想獲得相同的符號,但以UTF-8編碼。 我的意思是:我想要的源字符和目標字符總是相同(¢)但編碼不同。

有可能嗎? 另外:是否存在一個Java函數,該函數會自動執行此轉換(例如,通過傳遞開始編碼和結束編碼)?

預先感謝您的所有幫助。

你好西蒙妮

您可以使用字符串作為中介在各種編碼之間進行轉碼:

byte[] windows1252 = { (byte) 0xA2 };
String utf16 = new String(windows1252, Charset.forName("windows-1252"));
byte[] utf8 = utf16.getBytes(StandardCharsets.UTF_8);

在Java中, char數據始終為UTF-16。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM