[英]Python encoding issue in reading from text file
我正在閱讀一個包含單個單詞B\\xc3\\xa9zier
的文本文件。
我希望將其轉換為等效的utf-8解碼形式,即Bézier
並將其打印到控制台。
我的代碼如下:
foo=open("test.txt")
for line in foo.readlines():
for word in line.split():
print(word.decode('utf-8'))
foo.close()
輸出為:
B\xc3\xa9zier
但是,如果我做這樣的事情:
>>> print('B\xc3\xa9zier'.decode('utf-8'))
我得到正確的輸出:
Bézier
我不知道為什么會這樣?
似乎您在文件中有一個原始的utf8轉義字符串,請使用string_escape
進行解碼
with open('test.txt') as f:
for line in f:
for word in line.split():
print(word.decode('string_escape').decode('utf-8'))
Bézier
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.