從文本文件讀取Python編碼問題

Question

我正在閱讀一個包含單個單詞B\\xc3\\xa9zier的文本文件。

我希望將其轉換為等效的utf-8解碼形式，即Bézier並將其打印到控制台。

我的代碼如下：

foo=open("test.txt")  
for line in foo.readlines():  
    for word in line.split():  
        print(word.decode('utf-8'))
foo.close()

輸出為：

B\xc3\xa9zier

但是，如果我做這樣的事情：

>>> print('B\xc3\xa9zier'.decode('utf-8'))

我得到正確的輸出：

Bézier

我不知道為什么會這樣？

Answer 1

似乎您在文件中有一個原始的utf8轉義字符串，請使用string_escape進行解碼

with open('test.txt') as f:
    for line in f:
        for word in line.split():
            print(word.decode('string_escape').decode('utf-8'))


Bézier

從文本文件讀取Python編碼問題

問題描述

1 個解決方案

解決方案1
6 已采納 2013-06-04 11:11:18

從文本文件讀取Python編碼問題

問題描述

1 個解決方案

解決方案1 6 已采納 2013-06-04 11:11:18

解決方案1
6 已采納 2013-06-04 11:11:18