簡體   English   中英

如何在python中將unicode轉換為其原始字符

[英]How to convert unicode to its original character in Python

我首先嘗試輸入Unicode字符,並以UTF-8編碼,然后再解碼回去。 Python會愉快地返回原始字符。 我看了一下編碼后的字符串,它是b'\\xe6\\x88\\x91' 我不明白這是什么,它看起來像3個十六進制數字。

然后我做了一些研究,發現CJK集從4E00開始,所以現在我想讓Python向我展示這個字符的樣子。 我怎么做? 我是否需要將4E00轉換為上述形式?

您需要使用UTF-8編碼對其進行解碼:

>>> print(b'\xe6\x88\x91'.decode('UTF-8'))
我

通過解碼,您將字節(即b'...' )轉換為Unicode字符串,這就是顯示/使用文本的方式。

文本b'\\xe6\\x88\\x91'是字節的表示形式 ,它們是Unicode碼點\我的utf-8編碼,該字符是我。 因此,除了使用.decode('utf-8')轉換為unicode字符串外,無需進行任何轉換。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM