繁体   English   中英

处理ASCII文件中的Unicode字符?

[英]Dealing with Unicode characters in an ASCII file?

我有一个XML文件,使用C#中的XmlSerializer将其保存为ASCII / UTF-8。 一个字段包含一个文件夹路径位置。 我最近发现,在非英语Windows系统上,路径字段中可能会有特殊字符。 我可以将整个文件另存为Unicode / UTF-16,但是为了几个字符,文件大小增加了一倍。

是否可以将非ASCII字符插入其他ASCII字符串中?

没有ASCII / UTF-8这样的东西。 那是两种不同的编码,实际上是编码不同的字符集。 我怀疑您目前实际上正在使用ASCII或Windows ANSI。

UTF-8是Unicode的完整编码。 如果文件仅包含ASCII字符,则UTF-8编码与ASCII编码相同。 而且,如果您的文件主要是英语,则UTF-8是产生最小文件的Unicode编码。

结论:使用UTF-8。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM