[英]Python reading unicode from local files
我試圖讀取我本地的一些unicode文件。 如何在使用列表時讀取unicode文件? 我已經閱讀了python文檔,以及大量的stackoverflow Q&A,它已經回答了我的許多其他問題,但我找不到這個問題的答案。
任何幫助表示贊賞。
編輯:對不起,我的文件是utf-8。
您可以使用打開UTF-8編碼的文件
import codecs
with codecs.open("myutf8file.txt", encoding="utf-8-sig") as infile:
for line in infile:
# do something with line
請注意, codecs.open()
不會將\\r\\n
為\\n
,因此如果您使用的是Windows文件,則需要考慮這一點。
utf-8-sig
編解碼器將讀取帶或不帶BOM(字節順序標記)的 UTF-8文件(如果存在則將其剝離)。 在編寫時,您應該使用utf-8
作為編解碼器,因為Unicode標准建議不要在UTF-8文件中編寫BOM 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.