繁体   English   中英

对R脚本和/或R会话(环境)进行分区

[英]Partitioning R script and/or R sessions (environment)

好吧,我很好奇一个问题,如果不是世界末日的话,这将是有益且省时的。

我做了一些研究,但找不到我真正想要的。 另外,在运行多个R脚本/会话时,我检查了此链接,但再次并没有太大帮助。

情况是我有一个很大的数据集(我尝试使用的测试数据大约有650万行和50列,我也很难将数据集实现为R,我现在使用60k行进行分析和统计模型。(我尝试查看如何处理数据并理解其行为,希望我希望将这些模型和操作集成到大型数据集的所有工作中,即使不是全部6.5 m行,对于我来说1 2m都可以我可以)。

无论如何,另一个大问题是我的R环境。 由于数据非常庞大,因此需要勤奋工作。 该代码脚本大约有3500行,甚至还不到工作量的15%。 问题是通过创建新的数据集,分配新的模型,模型足够性检查和新的模型等,这一切都使我在环境中花了很多钱,而我的环境就像750mb(R会话/配置文件)。 我希望如果划分R脚本或环境,可以减少环境材料(配置文件)的大小。

任何想法都很棒。 寻求任何帮助。

编辑:创建干净的脚本并启动干净的环境后,数据库实现没有错误。 以防万一,像我这样遭受实施问题的人。 但是,不告诉这是唯一且确切的方法。

对于此问题,我通常会编写产生特定工作区的脚本,然后保留另一个脚本,该脚本包含所有脚本和已保存工作区的路径。

想象一下这个脚本:

## Dataset x
# Run script to create dataset x
source("pathtoscript.R")

# Save dataset x environment
save.image("pathtodatasetx.Rdata")

# Load dataset x environment
load("pathtodatasetx.Rdata")

这样,如果我进行了任何更改,或者将其加载到当前会话中,便可以快速运行并保存环境。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM