[英]Python: how to parse non-ASCII characters in string
在我的Python脚本中,我试图读取一个文本文件,其中包含带有人名和姓的列,其中一些列有非ASCII字符,如ñ
。 但是当我这样做时,我得到错误UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 66
。
从我在网上阅读的内容来看,我知道你可以通过忽略或删除非ASCII字符来处理这个问题,但我不想这样做。 是否有直接的方法将文件中的所有非ASCII字符转换为普通字符串?
目前,我正在使用infile = open(filename, 'rU')
打开我的文件。
不重复的问题 :我问的是如何读取带有unicode字符的文件,而不是如何将unicode字符串写入文件。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.