將轉義的unicode序列轉換為人類可讀的格式

Question

我一直在使用此python代碼：

pattern = u'丨フ丨ノ一丨ノ丶フノ一ノ丨フ一一ノフフ丶'
result = [u'<span id="z_i_t2_bis" title="\u7ad6\u6298\u7ad6\u6487\u6a2a\u7ad6\u6487\u637a\u6298\u6487\u6a2a\u6487\u7ad6\u6298\u6a2a\u6a2a\u6487\u6298\u6298\u637a">\u4e28\u30d5\u4e28\u30ce\u4e00\u4e28\u30ce\u4e36\u30d5\u30ce\u4e00\u30ce\u4e28\u30d5\u4e00\u4e00\u30ce\u30d5\u30d5\u4e36</span>']

if pattern in result[0]:
    print('found')

但這很麻煩，而且並沒有真正做到我想要的，這就是使逃脫的傻瓜變回可理解的東西，如這種模式。 是否有一些簡單的unix工具或命令來快速有效地執行此任務？

似乎這是一個可行的方法，但我嘗試了，但沒有成功。 即

result = "\u4e28\u30d5\u4e28\u30ce\u4e00\u4e28\u30ce\u4e36\u30d5\u30ce\u4e00\u30ce\u4e28\u30d5\u4e00\u4e00\u30ce\u30d5\u30d5\u4e36"

result.decode('utf-8')

哪個生成錯誤： attribute error 'str' object has no attribute 'decode'

Answer 1

如果僅print(result)那么您將獲得“ gobbledygook”，因為這就是Python在為您提供明確輸出作為列表或元組元素時所使用的方式。 但是，如果直接打印字符串print(result[0]) ，它將嘗試按原樣打印自然字符。

如果你想給自己的字符轉換為UTF-8，使用encode而不是decode 。 encode將Unicode字符串轉換為字節， decode將根據字節生成Unicode字符串。

將轉義的unicode序列轉換為人類可讀的格式

問題描述

1 個解決方案

解決方案1
1 已采納 2015-02-10 05:22:35

將轉義的unicode序列轉換為人類可讀的格式

問題描述

1 個解決方案

解決方案1 1 已采納 2015-02-10 05:22:35

解決方案1
1 已采納 2015-02-10 05:22:35