[英]Reading JSON: what encoding is “\u00c5\u0082”? How do I get it to a unicode object?
我正在解析的JSON文件中的值之一是Wroc\Å\aw
。 如何將該字符串轉換為產生“Wrocław”(在這種情況下是正確的解碼)的unicode對象?
看起來無論生成什么過程,JSON都會采用UTF-8編碼的文本並將其誤認為是Latin-1編碼的文本。 要解決該錯誤,請反向運行相同的過程:
>>> u'Wroc\u00c5\u0082aw'.encode('iso-8859-1').decode('utf-8')
u'Wroc\u0142aw'
>>> import unicodedata
>>> unicodedata.name(u'\u0142')
'LATIN SMALL LETTER L WITH STROKE'
看起來您的JSON沒有正確的編碼,因為\\ u00c5和\\ u0082aw都不會產生您期望的任何編碼字符。
但是您可能會嘗試將這個值編碼為UTF8或UTF16
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.