繁体   English   中英

Python:将unicode字符转换为对应的Unicode字符串

[英]Python: convert unicode character to corresponding Unicode string

如何在 Python 中将 unicode 字符 'ב' 转换为其相应的 Unicode 字符串 '\ב'?

前几天我问了相反的问题: Python: convert unicode string to相应的Unicode字符

像这样的工作

>>> hex(ord('ב'))
'0x5d1'

你可以做类似的事情,

>>> x
'ב'
>>> x.encode('ascii', 'backslashreplace').decode('utf-8')
'\\u05d1'

文档

errors 参数与 decode() 方法的参数相同,但支持更多可能的处理程序。 除了 'strict'、'ignore' 和 'replace'(在这种情况下插入一个问号而不是不可编码的字符),还有 'xmlcharrefreplace'(插入一个 XML 字符引用)、 backslashreplace替换(插入一个 \\ uNNNN 转义序列)和 namereplace(插入 \\N{...} 转义序列)。

Python 特定编码

unicode_escape - 编码适合作为 ASCII 编码的 Python 源代码中的 Unicode 文字的内容,但引号不会被转义。

'ב'.encode('unicode-escape').decode()         ### '\\u05d1'
print('ב'.encode('unicode-escape').decode())  ### \u05d1

我更喜欢我自己的简洁明了的答案:

json.dumps(unicode_character)
decoded_string = "ב"
encoded_string = decoded_string.encode("utf-8")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM