簡體   English   中英

在ISO-8559-1和cp1251之間轉換

[英]Converting between ISO-8559-1 and cp1251

我的Android應用程序使用的開源庫只接受ISO-8859-1編碼的文本數據。 我有一些來自東歐的用戶想要輸入cp1251編碼的文本。 這似乎是開源庫的限制,因為Java完全能夠支持這些格式以及unicode格式。

一種選擇是修改開源庫以支持多個字符集。 是否可以將cp1251轉換為ISO-8859-1然后再轉回? 由於它們都是8位語言編碼,因此您可能會在字節級別存儲相同數量的數據。 但是,當開源庫將字節數據加載到具有ISO-8859-1編碼的字符串中時,ISO-8859-1中不存在的任何字節值都可能引發異常。

我不是一個字符集專家,但是我無法找到進行此轉換的代碼示例,這讓我相信它不會起作用,至少不可靠。

你是對的,這根本不會很好。 CP1251中的大多數非ASCII字符在ISO8859-1中不存在。 (CP1251是東歐語言,包含很多西里爾字符; ISO8859-1是西歐語言,並且包含重復的拉丁字符,標點符號和符號。)有兩個字符代表兩者,但很少(而且幾乎所有這些都是標點符號)它可能對你沒有任何好處。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM