繁体   English   中英

r:如何使用lapply删除多个数据帧中来自单独列表的行号

[英]r: how to remove row numbers coming from a separate list in multiple data frames using lapply

我在列表对象中组织了许多数据框。 我还有第二个向量列表,其中包含要在数据帧中删除的行号。 每个数据帧要删除的行都不同。 因此,数据帧列表中的元素数量等于矢量列表中的元素数量。 这是我尝试过的代码:

test_list<-vector(mode="list",5)
test_list<-lapply(test_list, function(x) data.frame(1,1:10,"c"))
vec_list<-vector(mode="list",5)
vec_list<-lapply(vec_list, function (x) x<-sample(seq(1,10),4))
clean_list<-lapply(test_list, function (x,y) clean_list<-x[-y,],vec_list)

当具有多个对应对象列表时,使用Mapmapply函数比lapply更自然地使用。

Map(function(l, v) l[-v,], test_list, vec_list)

如果要使用lapply ,一种方法是:

  lapply(seq_along(test_list), function(i) test_list[[i]][-vec_list[[i]],])

基准测试

在中型列表数据上,

 set.seed(45)
 test_list<-vector(mode="list",25e3)
 test_list<-lapply(test_list, function(x) data.frame(1,1:10,"c"))
 vec_list<-vector(mode="list",25e3)
 vec_list<-lapply(vec_list, function (x) x<-sample(seq(1,10),4))

 library(microbenchmark)
 f1 <- function() lapply(seq_along(test_list), function(i) test_list[[i]][-vec_list[[i]],])
 f2 <- function() Map(function(l, v) l[-v,], test_list, vec_list)

 microbenchmark(f1(), f2(), unit="relative", times=25L)
 #Unit: relative
 #expr       min        lq  median       uq       max neval
 #f1() 0.9874164 0.9977816 1.00573 1.000419 0.9837334    25
 #f2() 1.0000000 1.0000000 1.00000 1.000000 1.0000000    25

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM