[英]List with hex escaped values to readable string in Python
我有一個這樣的清單:
['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>']
如何將此列表轉換為包含實際可讀元素的列表?
我相信它在ISO 8859-1中 。
使用.decode()
方法解碼字符串值; 您實際上正在查看UTF-8數據:
>>> print lst[0].decode('utf8')
<option value="284"> Historia </option>
>>> print lst[1].decode('utf8')
<option value="393"> Hälsa & skönhet </option>
前一個字節表示Unicode代碼點U + 00a0,這是一個不間斷的空格(
作為HTML實體):
>>> lst[0].decode('utf8')
u'<option value="284">\xa0\xa0\xa0\xa0 Historia </option>'
>>> lst[1].decode('utf8')
u'<option value="393">\xa0\xa0\xa0\xa0 H\xe4lsa & sk\xf6nhet </option>'
看起來像UTF-8:
>>> s=['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>']
>>> for v in s:
... print v.decode('utf8')
...
<option value="284"> Historia </option>
<option value="393"> Hälsa & skönhet </option>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.