在R中：快速在data.table中設置新值

Question

我試圖以一種有效的方式將值設置為data.table。 以下代碼可以完成我想要的操作，但是對於大型數據集來說太慢了：

DTcars<-as.data.table(mtcars)
for(i in 1:(dim(DTcars)[1]-1)){
  for(j in 1:dim(DTcars)[2]){
    if(DTcars[i,j, with=F]>10){
      set(DTcars,
          i=as.integer(i),
          j =as.integer(j)  ,
          value = DTcars[dim(DTcars)[1],j,with=F])
    }
  }
}

我想要這樣的代碼……這完全是錯誤的代碼，但是表達了我的需求，我認為這樣會更快。 這意味着我想對我的data.table進行子集化，並為特定列插入相同的值，並為每一列重復。

DTcars<-as.data.table(mtcars)
ns<-names(DTcars)
for(j in 1:length(ns)){
  DTcars[ns[j]>10]<-DTcars[20,ns[j]]
}

Answer 1

我想你在找

for (j in names(DTcars)) set(DTcars,
  i     = which(DTcars[[j]]>10),
  j     = j,
  value = tail(DTcars[[j]],1)
)

列號或名稱可用作此處的for迭代器。

該value在OP中的兩段代碼之間變化，因此我不確定。

Answer 2

應當謹慎使用IMO set ，而常規:=幾乎總是足夠的：

for (col in names(DTcars))
  DTcars[get(col) > 10, (col) := get(col)[.N]]

在R中：快速在data.table中設置新值

問題描述

2 個解決方案

解決方案1
3 2015-07-23 15:02:18

解決方案2
2 已采納 2015-07-23 16:07:47

在R中：快速在data.table中設置新值

問題描述

2 個解決方案

解決方案1 3 2015-07-23 15:02:18

解決方案2 2 已采納 2015-07-23 16:07:47

解決方案1
3 2015-07-23 15:02:18

解決方案2
2 已采納 2015-07-23 16:07:47