[英]Read gz file in python
我正在尝试读取/提取文件train.gz
的内容
我的代码:
import gzip
with gzip.open('train.gz', 'rb') as f:
file_content = f.read()
当我运行时:
print(file_content)
我收到此错误(在 jupyter 笔记本上):
---------------------------------------------------------------------------
MemoryError Traceback (most recent call last)
/tmp/ipykernel_2392/4036593255.py in <module>
----> 1 print(file_content)
MemoryError:
有什么建议么?
我
MemoryError表明该文件太大,您的运行时无法处理。
IIGC train.gz
可能是训练 model 并且您可能必须将此 model 作为单个块处理。 如果是这样,您最好的解决方案是找到更大(更多内存)的机器。
如果可能(并且强烈推荐),您应该通过您的程序 stream 未压缩的文件,以便您可以将缓冲区|内存中 window 限制在它上面,从而限制您用完 ZCD69B4957F06CD8191ZBF3 的可能性。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.