簡體   English   中英

讀取JSON:“ \\ u00c5 \\ u0082”是什么編碼? 如何將其獲取到unicode對象?

[英]Reading JSON: what encoding is “\u00c5\u0082”? How do I get it to a unicode object?

我正在解析的JSON文件中的值之一是Wroc\Å\‚aw 如何將該字符串轉換為產生“Wrocław”(在這種情況下是正確的解碼)的unicode對象?

看起來無論生成什么過程,JSON都會采用UTF-8編碼的文本並將其誤認為是Latin-1編碼的文本。 要解決該錯誤,請反向運行相同的過程:

>>> u'Wroc\u00c5\u0082aw'.encode('iso-8859-1').decode('utf-8')
u'Wroc\u0142aw'
>>> import unicodedata
>>> unicodedata.name(u'\u0142')
'LATIN SMALL LETTER L WITH STROKE'

看起來您的JSON沒有正確的編碼,因為\\ u00c5和\\ u0082aw都不會產生您期望的任何編碼字符。

但是您可能會嘗試將這個值編碼為UTF8或UTF16

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM