簡體   English   中英

處理ASCII文件中的Unicode字符?

[英]Dealing with Unicode characters in an ASCII file?

我有一個XML文件,使用C#中的XmlSerializer將其保存為ASCII / UTF-8。 一個字段包含一個文件夾路徑位置。 我最近發現,在非英語Windows系統上,路徑字段中可能會有特殊字符。 我可以將整個文件另存為Unicode / UTF-16,但是為了幾個字符,文件大小增加了一倍。

是否可以將非ASCII字符插入其他ASCII字符串中?

沒有ASCII / UTF-8這樣的東西。 那是兩種不同的編碼,實際上是編碼不同的字符集。 我懷疑您目前實際上正在使用ASCII或Windows ANSI。

UTF-8是Unicode的完整編碼。 如果文件僅包含ASCII字符,則UTF-8編碼與ASCII編碼相同。 而且,如果您的文件主要是英語,則UTF-8是產生最小文件的Unicode編碼。

結論:使用UTF-8。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM