[英]How to turn unicode character into \Uxxxxxxxx format in python 3
我有一个类似🏆的Unicode字符,我想恢复\\ Uxxxxxxxx格式。 但是直到现在,还找不到简单的方法。 已经尝试过:
text = 🏆
text.encode('utf-32').decode('utf-8')
returns error: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
text.encode('utf-32').decode('unicode-escape')
returns ÿþ
如何使其返回\\ U000XXXXX? 我知道我可以从\\ U000XXXXX制作角色:
string = "foo bar foo \U000XXXXX"
string.encode('utf-8').decode('unicode-escape')
returns "foo bar foo 🏆"
对于字节字符串:
>>> text = '🏆'
>>> text.encode('unicode-escape')
b'\\U0001f3c6'
对于Unicode字符串:
>>> text.encode('unicode-escape').decode('ascii')
'\\U0001f3c6'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.