[英](python utf-8) using 'à','ç','é','è','ê','ë','î','ô','ù'
[英]UTF-8 in Python
這似乎是國際開發人員中的常見問題,但我還沒有找到一個直接的答案。 我從提要中得到以下字符串:“ Carlos e Carlos mostram o queháde melhor na internet”
以下錯誤返回到控制台:UnicodeDecodeError:'utf8'編解碼器無法解碼位置31-33中的字節:無效數據
提前致謝,
FBR
即使是UTF-8,也不能僅僅使用一些隨機編碼進行解碼。 您必須使用HTTP標頭中返回的編碼或文檔中的等效編碼(例如HTML的META
元素)進行解碼。
如果編碼不可用或不正確,則應在解碼操作中指定在無效字節序列上會發生什么; 通常, 'replace'
就足夠了。
>>> print u'Carlos e Carlos mostram o que há de melhor na internet'.encode('latin1').decode('utf-8', 'replace')
Carlos e Carlos mostram o que h�e melhor na internet
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.