[英]Python: convert unicode string to corresponding Unicode character
[英]Python: convert unicode character to corresponding Unicode string
如何在 Python 中将 unicode 字符 'ב' 转换为其相应的 Unicode 字符串 '\ב'?
前几天我问了相反的问题: Python: convert unicode string to相应的Unicode字符
像这样的工作
>>> hex(ord('ב'))
'0x5d1'
你可以做类似的事情,
>>> x
'ב'
>>> x.encode('ascii', 'backslashreplace').decode('utf-8')
'\\u05d1'
从文档:
errors 参数与 decode() 方法的参数相同,但支持更多可能的处理程序。 除了 'strict'、'ignore' 和 'replace'(在这种情况下插入一个问号而不是不可编码的字符),还有 'xmlcharrefreplace'(插入一个 XML 字符引用)、
backslashreplace
替换(插入一个 \\ uNNNN 转义序列)和 namereplace(插入 \\N{...} 转义序列)。
unicode_escape
- 编码适合作为 ASCII 编码的 Python 源代码中的 Unicode 文字的内容,但引号不会被转义。
'ב'.encode('unicode-escape').decode() ### '\\u05d1'
print('ב'.encode('unicode-escape').decode()) ### \u05d1
我更喜欢我自己的简洁明了的答案:
json.dumps(unicode_character)
decoded_string = "ב"
encoded_string = decoded_string.encode("utf-8")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.