繁体   English   中英

在Python中使用硬盘而不是RAM

[英]Use hard drive instead of RAM in Python

我想知道是否有方法或Python包可以让我使用大型数据集而无需将其写入RAM。

我也在使用pandas进行统计功能。

我需要访问整个数据集,因为许多统计函数需要整个数据集才能返回可靠的结果。

我在使用Windows 10的LiClipse上使用PyDev(带有解释器Python 3.4)。

您也可以使用SframesDask进行大型数据集支持,或者使用pandas和read / iterate in chunk,以最大限度地减少RAM使用。 另外值得一看火焰

读入块:

chunksize = 10 ** 6
for chunk in pd.read_csv(filename, chunksize=chunksize):
process(chunk)

如果您只需要将磁盘虚拟化为大型RAM内存,则可以在系统上设置交换文件。 然后,内核将根据需要自动交换页面,使用启发式方法确定应交换的页面以及应保留在磁盘上的页面。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM