python 如何從文件中讀取字節類型數據並將其轉換為 utf-8？

Question

我需要從 test.txt 讀取文件內容並將其轉換為 utf-8 編碼（可讀中文）。

這似乎是一項簡單的任務，但使用 open()、codecs.open() 等，它總是將行讀取為 str 類型，而不是將其識別為字節。

with codecs.open(input_file, 'rb') as reader:
    for line in reader:
        print(type(line))
        # if it is bytes
        #print(line.decode('utf-8'))

我的輸入文件內容是 test.txt：

b'\xe5\x95\x8a \xe6\x9c\x89 \xe4\xbb\x80 \xe4\xb9\x88 \xe4\xba\x8b \xe5\x95\x8a \xe6\x9c\x89 \xe4\xbb\x80 \xe4\xb9\x88 \xe4\xba\x8b \xe7\xbb\x99 \xe6\x88\x91 \xe6\x89\x93 \xe7\x94\xb5 \xe8\xaf\x9d \xe5\x95\x8a \xe5 \x97\xaf \xe5\x97\xaf \xe5\xa5\xbd \xe5\xa5\xbd \xe5\xa5\xbd \xe5\xa5\xbd \xe5\x86\x8d \xe8\xa7\x81 \xe5\x93 \x8e \xe5\x86\x8d \xe8\xa7\x81 \xe5\x97\xaf \xe5\xa5\xbd'

我期望它如下，但需要從文件中讀取內容：

控制台上的預期結果示例

我該怎么做？ 我用谷歌搜索了很多，但沒有運氣。 請幫忙。

Answer 1

您應該將編碼指定為 open 的參數，即

import codecs
with codecs.open("test.txt", encoding="utf-8") as reader:
    for line in reader:
        print(line)

python 如何從文件中讀取字節類型數據並將其轉換為 utf-8？

問題描述

1 個解決方案

解決方案1
2 2022-07-27 10:03:13

python 如何從文件中讀取字節類型數據並將其轉換為 utf-8？

問題描述

1 個解決方案

解決方案1 2 2022-07-27 10:03:13

解決方案1
2 2022-07-27 10:03:13