[英]encode 'UCS-2 Little Endian' file to 'utf8' using python error
我正在尝试使用python将UCS-2 Little Endian文件编码为utf8 ,我收到了一个奇怪的错误。
我正在使用的代码:
file=open("C:/AAS01.txt", 'r', encoding='utf8')
lines = file.readlines()
file.close()
我收到以下错误:
Traceback (most recent call last):
File "C:/Users/PycharmProjects/test.py", line 18, in <module>
main()
File "C:/Users/PycharmProjects/test.py", line 7, in main
lines = file.readlines()
File "C:\Python34\lib\codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
我试图使用编解码器命令,但也没有工作......任何想法我能做什么?
要open
的encoding
参数设置输入编码。 使用encoding='utf_16_le'
。
如果您正在尝试阅读UCS-2,为什么要告诉Python它是UTF-8? 0xff很可能是小端字节顺序标记的第一个字节:
>>> codecs.BOM_UTF16_LE
b'\xff\xfe'
UCS-2也被弃用了,原因很简单,Unicode已经超过了它。 典型的替代品是UTF-16。
Python 3中链接的更多信息:阅读UCS-2(BE)文件
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.