繁体 English 中英

读取JSON：“ \\ u00c5 \\ u0082”是什么编码？如何将其获取到unicode对象？

[英]Reading JSON: what encoding is “\u00c5\u0082”? How do I get it to a unicode object?

原文 2013-10-03 14:10:33 1 2 python/ json/ unicode

我正在解析的JSON文件中的值之一是Wroc\Å\aw 。 如何将该字符串转换为产生“Wrocław”（在这种情况下是正确的解码）的unicode对象？

2 个解决方案

看起来无论生成什么过程，JSON都会采用UTF-8编码的文本并将其误认为是Latin-1编码的文本。 要解决该错误，请反向运行相同的过程：

>>> u'Wroc\u00c5\u0082aw'.encode('iso-8859-1').decode('utf-8')
u'Wroc\u0142aw'
>>> import unicodedata
>>> unicodedata.name(u'\u0142')
'LATIN SMALL LETTER L WITH STROKE'

看起来您的JSON没有正确的编码，因为\\ u00c5和\\ u0082aw都不会产生您期望的任何编码字符。

但是您可能会尝试将这个值编码为UTF8或UTF16

如何从解码的JSON对象中删除“u”？

[英]How do I get rid of the “u” from a decoded JSON object?

如何在python中的代码点上拆分unicode字符串？（例如\\ u00B7或\\ u2022）？

[英]How do I split a unicode string on code points in python? (eg. \u00B7 or \u2022)?

打印带有UTF-8编码字符的字符串，例如：“ \\ u00c5 \\ u009b \\”

[英]Printing strings with UTF-8 encoded characters, e.g.: “\u00c5\u009b\”

不是“\ u”：如何在JSON中使用Unicode？

[英]Not “\u”: How to Unescape Unicode in JSON?

JSON包含错误的UTF-8 \\ u00ce \\ u00b2而不是Unicode \\ u03b2，如何在Python中修复？

[英]JSON contains incorrect UTF-8 \u00ce\u00b2 instead of Unicode \u03b2, how to fix in Python?

如何在python中将unicode u'\\ xb0C'从SQL更改为字符串°C？

[英]How do I change unicode u'\xb0C' from SQL to string °C in python?

如何从JSON项中删除Unicode u？

[英]How can I remove the Unicode u from a JSON item?

如何摆脱代码中的 U+200B（Unicode 零宽度空间）？

[英]How do I get rid of U+200B (Unicode zero width space) in my code?

Python - unicode字符串中的ASCII编码字符串; 如何删除'你'？

[英]Python - ASCII encoding string in the unicode string; how to remove that 'u'?

Python Unicode 字符串在文件中存储为 '\蒸\汽\地'，如何将其转换回 Unicode？

[英]Python Unicode string stored as '\u84b8\u6c7d\u5730' in file, how to convert it back to Unicode?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何从解码的JSON对象中删除“u”？如何在python中的代码点上拆分unicode字符串？（例如\\ u00B7或\\ u2022）？打印带有UTF-8编码字符的字符串，例如：“ \\ u00c5 \\ u009b \\” 不是“\ u”：如何在JSON中使用Unicode？ JSON包含错误的UTF-8 \\ u00ce \\ u00b2而不是Unicode \\ u03b2，如何在Python中修复？如何在python中将unicode u'\\ xb0C'从SQL更改为字符串°C？如何从JSON项中删除Unicode u？如何摆脱代码中的 U+200B（Unicode 零宽度空间）？ Python - unicode字符串中的ASCII编码字符串; 如何删除'你'？ Python Unicode 字符串在文件中存储为 '\蒸\汽\地'，如何将其转换回 Unicode？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM