繁体   English   中英

用python解码文本

[英]Decoding text in python

我想知道如何解码某些文本,并找到了一些我想解码的文本:

\xe2\x80\x93

我知道打印它可以解决问题,但是我正在构建一个Web爬网程序,因此我需要构建一个包含单词的索引(字典),并在其中列出出现该单词的URL。

因此,我想做这样的事情:

dic = {}
dic['\xe2\x80\x93'] = 'http://example.com' #this is the url where the word appears

...但是当我这样做时:

print dic

我得到:

'\xe2\x80\x93'

而不是... –

但是当我print dic['\\xe2\\x80\\x93']我成功获得–

我如何也可以通过print dic获得–

当您看到\\xhh ,这是一个字符转义序列。 在这种情况下,它将向您显示字符的十六进制值(请参阅: 词法分析:string-literals )。

有时会看到\\xhh的原因,并且在使用print时会看到实际字符的__str__与Python中__str____repr__之间区别有关。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM