[英]Unicode encoding/decoding
我有一个看起来像这样的字符串。
st = '/M\xe4rzen'
我想将其转换为unicode。 我怎样才能做到这一点? 我试过了:
st.decode('utf-8')
unicode(t, 'utf-8')
原始文件是utf-8编码的,但我似乎无法获得字符串的unicode表示。
您的数据不是UTF8编码的; 更有可能是使用Latin-1编码:
>>> print st.decode('latin1')
/Märzen
调用.decode()
就足够了,不需要也调用unicode()
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.