[英]Decoding text in python
我想知道如何解码某些文本,并找到了一些我想解码的文本:
\xe2\x80\x93
我知道打印它可以解决问题,但是我正在构建一个Web爬网程序,因此我需要构建一个包含单词的索引(字典),并在其中列出出现该单词的URL。
因此,我想做这样的事情:
dic = {}
dic['\xe2\x80\x93'] = 'http://example.com' #this is the url where the word appears
...但是当我这样做时:
print dic
我得到:
'\xe2\x80\x93'
而不是... –
。
但是当我print dic['\\xe2\\x80\\x93']
我成功获得–
。
我如何也可以通过print dic
获得–
?
当您看到\\xhh
,这是一个字符转义序列。 在这种情况下,它将向您显示字符的十六进制值(请参阅: 词法分析:string-literals )。
有时会看到\\xhh
的原因,并且在使用print
时会看到实际字符的__str__
与Python中__str__
和__repr__
之间的区别有关。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.