如何編碼像字典列表這樣的對象，其中包含Unicode密鑰或utf8值？

Question

有什么簡單的方法可以將包含unicode字符串的對象轉換為utf8？

例如：

before = [ 
    u'labelset': {u'labelset_id': 80L, u'labelset_name': u'\u6d17\u8863\u6a5f'},
    u'labelset': {u'labelset_id': 81L, u'labelset_name': u'\u6d17\u8863\u6a5f'},
    u'labelset': {u'labelset_id': 82L, u'labelset_name': u'\u6d17\u8863\u6a5f'},
]

after = [
    'labelset': {labelset_id: 80L, labelset_name: 'test'},
    'labelset': {labelset_id: 81L, labelset_name: 'test'},
    'labelset': {labelset_id: 81L, labelset_name: 'test'},
]

Answer 1

在python 2. *中，有兩種類型的字符串：

str (sequence of bytes)
unicode (sequence of unicode code points)

要將unicode轉換為str，需要指定規則（哪些字節代表特定的unicode點）。 此規則稱為編碼。 因此，改造的unicode為str，使用utf8編碼，您需要使用encode方法：

>>> u'\u6d17\u8863\u6a5f'.encode('utf8')
'\xe6\xb4\x97\xe8\xa1\xa3\xe6\xa9\x9f'

結果將是一個字節序列，可以將其保存到例如文本文件中。

要將str轉換回unicode，您需要知道在從unicode轉換到str的過程中應用了哪些規則。 在當前情況下，此規則是utf8編碼。 為此，請使用decode方法：

>>> '\xe6\xb4\x97\xe8\xa1\xa3\xe6\xa9\x9f'.decode('utf8')
u'\u6d17\u8863\u6a5f'

這是有關python字符串和編碼的很好的演示

如何編碼像字典列表這樣的對象，其中包含Unicode密鑰或utf8值？

問題描述

1 個解決方案

解決方案1
1 2013-05-09 08:26:44

如何編碼像字典列表這樣的對象，其中包含Unicode密鑰或utf8值？

問題描述

1 個解決方案

解決方案1 1 2013-05-09 08:26:44

解決方案1
1 2013-05-09 08:26:44