[英]Read gz file in python
我正在嘗試讀取/提取文件train.gz
的內容
我的代碼:
import gzip
with gzip.open('train.gz', 'rb') as f:
file_content = f.read()
當我運行時:
print(file_content)
我收到此錯誤(在 jupyter 筆記本上):
---------------------------------------------------------------------------
MemoryError Traceback (most recent call last)
/tmp/ipykernel_2392/4036593255.py in <module>
----> 1 print(file_content)
MemoryError:
有什么建議么?
我
MemoryError表明該文件太大,您的運行時無法處理。
IIGC train.gz
可能是訓練 model 並且您可能必須將此 model 作為單個塊處理。 如果是這樣,您最好的解決方案是找到更大(更多內存)的機器。
如果可能(並且強烈推薦),您應該通過您的程序 stream 未壓縮的文件,以便您可以將緩沖區|內存中 window 限制在它上面,從而限制您用完 ZCD69B4957F06CD8191ZBF3 的可能性。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.