簡體   English   中英

從文本文件讀取Python編碼問題

[英]Python encoding issue in reading from text file

我正在閱讀一個包含單個單詞B\\xc3\\xa9zier的文本文件。

我希望將其轉換為等效的utf-8解碼形式,即Bézier並將其打印到控制台。

我的代碼如下:

foo=open("test.txt")  
for line in foo.readlines():  
    for word in line.split():  
        print(word.decode('utf-8'))
foo.close()

輸出為:

B\xc3\xa9zier

但是,如果我做這樣的事情:

>>> print('B\xc3\xa9zier'.decode('utf-8'))

我得到正確的輸出:

Bézier

我不知道為什么會這樣?

似乎您在文件中有一個原始的utf8轉義字符串,請使用string_escape進行解碼

with open('test.txt') as f:
    for line in f:
        for word in line.split():
            print(word.decode('string_escape').decode('utf-8'))


Bézier

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM