对R脚本和/或R会话（环境）进行分区

Question

好吧，我很好奇一个问题，如果不是世界末日的话，这将是有益且省时的。

我做了一些研究，但找不到我真正想要的。 另外，在运行多个R脚本/会话时，我检查了此链接，但再次并没有太大帮助。

情况是我有一个很大的数据集（我尝试使用的测试数据大约有650万行和50列，我也很难将数据集实现为R，我现在使用60k行进行分析和统计模型。（我尝试查看如何处理数据并理解其行为，希望我希望将这些模型和操作集成到大型数据集的所有工作中，即使不是全部6.5 m行，对于我来说1 2m都可以我可以）。

无论如何，另一个大问题是我的R环境。 由于数据非常庞大，因此需要勤奋工作。 该代码脚本大约有3500行，甚至还不到工作量的15％。 问题是通过创建新的数据集，分配新的模型，模型足够性检查和新的模型等，这一切都使我在环境中花了很多钱，而我的环境就像750mb（R会话/配置文件）。 我希望如果划分R脚本或环境，可以减少环境材料（配置文件）的大小。

任何想法都很棒。 寻求任何帮助。

编辑：创建干净的脚本并启动干净的环境后，数据库实现没有错误。 以防万一，像我这样遭受实施问题的人。 但是，不告诉这是唯一且确切的方法。

Answer 1

对于此问题，我通常会编写产生特定工作区的脚本，然后保留另一个脚本，该脚本包含所有脚本和已保存工作区的路径。

想象一下这个脚本：

## Dataset x
# Run script to create dataset x
source("pathtoscript.R")

# Save dataset x environment
save.image("pathtodatasetx.Rdata")

# Load dataset x environment
load("pathtodatasetx.Rdata")

这样，如果我进行了任何更改，或者将其加载到当前会话中，便可以快速运行并保存环境。

对R脚本和/或R会话（环境）进行分区

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-08-22 08:12:49

对R脚本和/或R会话（环境）进行分区

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-08-22 08:12:49

解决方案1
0 已采纳 2017-08-22 08:12:49