Python字符串編碼方法

Question

在Python中，unicode字符串中有一個encode方法，用於從unicode到byte字符串進行編碼。 在字符串中有一個decode方法來執行相反的操作。

但我很困惑字符串中的encode方法是什么？

Answer 1

它對非文本編解碼器很有用。

>>> 'Hello, world!'.encode('hex')
'48656c6c6f2c20776f726c6421'
>>> 'Hello, world!'.encode('base64')
'SGVsbG8sIHdvcmxkIQ==\n'
>>> 'Hello, world!'.encode('zlib')
'x\x9c\xf3H\xcd\xc9\xc9\xd7Q(\xcf/\xcaIQ\x04\x00 ^\x04\x8a'

Answer 2

它首先使用默認編碼解碼為Unicode，然后編碼回字節字符串。

>>> import sys
>>> sys.getdefaultencoding()
'ascii'
>>> sys.setdefaultencoding('latin-1')
>>> '\xc4'.encode('utf-8')
'\xc3\x84'

對於Ä， '\\xc4'為Latin-1，對於Ä， '\\xc3\\x84'為UTF-8。

Answer 3

你為什么不想自己閱讀精美的Python文檔？

http://docs.python.org/release/2.5.2/lib/string-methods.html

msgstr“”“編碼（[encoding [，errors]]）返回字符串的編碼版本。默認編碼是當前的默認字符串編碼。可以給出錯誤來設置不同的錯誤處理方案。錯誤的默認值是'strict' ，意味着編碼錯誤會引發UnicodeError。其他可能的值是'ignore'，'replace'，'xmlcharrefreplace'，'backslashreplace'以及通過codecs.register_error注冊的任何其他名稱，請參閱第4.8.1節。有關可能的編碼列表，請參閱第4.8.3節。版本2.0中的新增內容。版本2.3中已更改：添加了對“xmlcharrefreplace”和“backslashreplace”以及其他錯誤處理方案的支持。“”

Python字符串編碼方法

問題描述

3 個解決方案

解決方案1
10 已采納 2011-03-03 06:48:32

解決方案2
5 2011-03-03 06:47:13

解決方案3
-4 2011-03-03 07:15:09

Python字符串編碼方法

問題描述

3 個解決方案

解決方案1 10 已采納 2011-03-03 06:48:32

解決方案2 5 2011-03-03 06:47:13

解決方案3 -4 2011-03-03 07:15:09

解決方案1
10 已采納 2011-03-03 06:48:32

解決方案2
5 2011-03-03 06:47:13

解決方案3
-4 2011-03-03 07:15:09