[英]Convert str to unicode in python
美好的一天! 我在将文本解码为unicode时遇到麻烦。 我需要转换等于
'\u4038' # or something like that
以ASCII格式,我需要将此字符串转换为一个unicode符号。 你能解释一下<如何做吗? 的
len(unicode('\u4038'))
打印6,所以这不是解决方案:(
如果需要,在大多数情况下,生成的符号为西里尔字母。
如果您的意思是字符串'\\\䀸'
,则可以使用unicode-escape
编码 :
>>> s = b'\\u4038' # == br'\u4038'
>>> print(s)
\u4038
>>> len(s)
6
>>> print(s.decode('unicode-escape'))
䀸
>>> len(s.decode('unicode-escape'))
1
也许有更好的方法,但是这里有一个:
In [27]: s = r'\u4038'
In [28]: len(ast.literal_eval('u"' + s + '"'))
Out[28]: 1
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.