[英]How to subset ffdf by index?
我想按索引子集一个ffdf对象,返回另一个ffdf对象。
有关subset.ffdf的帮助文件 ,您可以将范围索引(ri)对象作为参数传递,但是当我尝试执行以下操作时:
data_subset <- subset.ffdf(data, ri(1, 1e5))
我收到此错误:
Error in which(eval(e, nl, envir)) : argument to 'which' is not logical
根据You-Leee的建议,我尝试使用此代码传递感兴趣的索引的逻辑向量:
n <- length(data[[1]]) #10.5 million
logical_index = c(1, 1e5) == seq.int(1, n)
data_subset <- subset(data, logical_index)
我尝试运行两次,每次我的R-Studio崩溃并显示消息R encountered a fatal error. The session was terminated.
R encountered a fatal error. The session was terminated.
起初我以为这可能是内存限制,但是从我的活动监视器来看,我仍然有8GB可用的4GB。 此外,这也不应该过多地加载到内存中。
该参数必须是逻辑上的,因此您必须在所需的索引上输入TRUE,否则输入FALSE:
> data <- ffdf(a = ff(1:12))
> subset.ffdf(data, c(1, 1e5) == seq.int(1, length(data$a)))
ffdf (all open) dim=c(1,1), dimorder=c(1,2) row.names=NULL
ffdf virtual mapping
PhysicalName VirtualVmode PhysicalVmode AsIs VirtualIsMatrix PhysicalIsMatrix
a a integer integer FALSE FALSE FALSE
PhysicalElementNo PhysicalFirstCol PhysicalLastCol PhysicalIsOpen
a 1 1 1 TRUE
ffdf data
a
1 1
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.