[英]how can i decode unicode string in python?
Wikipedia API将字符串编码为unicode格式
"Golden Globe Award for Best Motion Picture \u2013 Drama"
我如何将其转换回
"Golden Globe Award for Best Motion Picture – Drama"
Wikipedia API返回JSON数据,使用json
模块进行解码:
json.loads(inputstring)
演示:
>>> import json
>>> print json.loads('"Golden Globe Award for Best Motion Picture \u2013 Drama"')
Golden Globe Award for Best Motion Picture – Drama
相反,如果您有一个以u''
开头的字符串,则您已经有一个python unicode值,并且正在查看该字符串的表示形式:
>>> json.loads('"Golden Globe Award for Best Motion Picture \u2013 Drama"')
u'Golden Globe Award for Best Motion Picture \u2013 Drama'
只需打印该值即可让Python将其编码到您的终端编解码器中,并以终端会理解的格式表示该破折号字符。
如果您不了解unicode值和字节字符串之间的区别,则可能需要继续学习Python和Unicode及其编码。
每个软件开发人员绝对,肯定必须绝对了解Unicode和字符集(无借口!)作者:Joel Spolsky
Ned Batchelder的实用Unicode
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.