用python解码文本

Question

我想知道如何解码某些文本，并找到了一些我想解码的文本：

\xe2\x80\x93

我知道打印它可以解决问题，但是我正在构建一个Web爬网程序，因此我需要构建一个包含单词的索引（字典），并在其中列出出现该单词的URL。

因此，我想做这样的事情：

dic = {}
dic['\xe2\x80\x93'] = 'http://example.com' #this is the url where the word appears

...但是当我这样做时：

print dic

我得到：

'\xe2\x80\x93'

而不是... â€“ 。

但是当我print dic['\\xe2\\x80\\x93']我成功获得â€“ 。

我如何也可以通过print dic获得â€“ ？

Answer 1

当您看到\\xhh ，这是一个字符转义序列。 在这种情况下，它将向您显示字符的十六进制值（请参阅：词法分析：string-literals ）。

有时会看到\\xhh的原因，并且在使用print时会看到实际字符的__str__与Python中__str__和__repr__之间的区别有关。