簡體   English   中英

Python從本地文件中讀取unicode

[英]Python reading unicode from local files

我試圖讀取我本地的一些unicode文件。 如何在使用列表時讀取unicode文件? 我已經閱讀了python文檔,以及大量的stackoverflow Q&A,它已經回答了我的許多其他問題,但我找不到這個問題的答案。

任何幫助表示贊賞。

編輯:對不起,我的文件是utf-8。

您可以使用打開UTF-8編碼的文件

import codecs
with codecs.open("myutf8file.txt", encoding="utf-8-sig") as infile:
    for line in infile:
        # do something with line

請注意, codecs.open()不會將\\r\\n\\n ,因此如果您使用的是Windows文件,則需要考慮這一點。

utf-8-sig編解碼器將讀取帶或不帶BOM(字節順序標記)的 UTF-8文件(如果存在則將其剝離)。 在編寫時,您應該使用utf-8作為編解碼器,因為Unicode標准建議不要在UTF-8文件中編寫BOM

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM