如何在python中將unicode字符串轉換為普通文本

Question

考慮我有一個Unicode字符串（不是真正的unicode，而是看起來像unicode的字符串）。 我想得到它的utf-8變種。 我怎么能在Python中做到這一點？ 例如，如果我有像這樣的字符串：

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"

我該怎么做才能得到它的utf-8變體（格魯吉亞符號）：

ისრაელი==იერუსალიმი

簡單地說，我希望有這樣的代碼：

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"
utfTitle = title.TurnToUTF()
print(utfTitle)

我希望這段代碼有輸出：

ისრაელი==იერუსალიმი

Answer 1

您可以使用unicode-escape編解碼器來擺脫雙反斜杠並有效地使用字符串。

假設title是str ，則需要在解碼回unicode（ str ）之前先對字符串進行編碼。

>>> t = title.encode('utf-8').decode('unicode-escape')
>>> t
'ისრაელი == იერუსალიმი'

如果title是一個bytes實例，你可以直接解碼：

>>> t = title.decode('unicode-escape')
>>> t
'ისრაელი == იერუსალიმი'

Answer 2

干得好。 只需使用decode方法並應用unicode_escape

對於Python 2.x

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"
utfTitle = title.decode('unicode_escape')
print(utfTitle)

#output :ისრაელი == იერუსალიმი

對於python 3.x

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"
print(title.encode('ascii').decode('unicode-escape'))

Answer 3

假設unicode是str類型並使用decode和unicode-escape方法進行轉換

title="\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"

res1 = title.encode('utf-8')

res2 = res1.decode('unicode-escape')

print(res2)

如何在python中將unicode字符串轉換為普通文本

問題描述

3 個解決方案

解決方案1
5 已采納 2017-12-28 11:18:34

解決方案2
4 2017-12-28 11:18:00

解決方案3
0 2017-12-28 14:11:19

如何在python中將unicode字符串轉換為普通文本

問題描述

3 個解決方案

解決方案1 5 已采納 2017-12-28 11:18:34

解決方案2 4 2017-12-28 11:18:00

解決方案3 0 2017-12-28 14:11:19

解決方案1
5 已采納 2017-12-28 11:18:34

解決方案2
4 2017-12-28 11:18:00

解決方案3
0 2017-12-28 14:11:19