用十六進制轉義值列出到Python中可讀的字符串

Question

我有一個這樣的清單：

['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>']

如何將此列表轉換為包含實際可讀元素的列表？

我相信它在ISO 8859-1中。

Answer 1

使用.decode()方法解碼字符串值； 您實際上正在查看UTF-8數據：

>>> print lst[0].decode('utf8')
<option value="284">     Historia </option>
>>> print lst[1].decode('utf8')
<option value="393">     Hälsa & skönhet </option>

前一個字節表示Unicode代碼點U + 00a0，這是一個不間斷的空格（  作為HTML實體）：

>>> lst[0].decode('utf8')
u'<option value="284">\xa0\xa0\xa0\xa0 Historia </option>'
>>> lst[1].decode('utf8')
u'<option value="393">\xa0\xa0\xa0\xa0 H\xe4lsa & sk\xf6nhet </option>'

Answer 2

看起來像UTF-8：

>>> s=['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>']
>>> for v in s:
...     print v.decode('utf8')
...     
<option value="284">     Historia </option>
<option value="393">     Hälsa & skönhet </option>

用十六進制轉義值列出到Python中可讀的字符串

問題描述

2 個解決方案

解決方案1
1 已采納 2013-01-26 22:47:21

解決方案2
0 2013-01-26 22:54:05

用十六進制轉義值列出到Python中可讀的字符串

問題描述

2 個解決方案

解決方案1 1 已采納 2013-01-26 22:47:21

解決方案2 0 2013-01-26 22:54:05

解決方案1
1 已采納 2013-01-26 22:47:21

解決方案2
0 2013-01-26 22:54:05