[英]Match a vector to a list of vectors
我有一個矢量列表lis
,我需要匹配另一個矢量vec
lis <- list(c(2,0,0),c(1,1,0), c(1,0,1), c(0,2,0), c(0,1,1), c(0,0,2))
vec <- c(1,1,0)
所以我要么得到合理的輸出
[1] FALSE TRUE FALSE FALSE FALSE FALSE
或者只是內的位置lis
比賽
我一直在嘗試這些方面:
unlist(lis) %in% vec
但問題是數字的位置很重要,即區分c(1,1,0)
和c(1,0,1)
,這是我無法做到的。 我想避免for
循環,因為這需要非常高效(快速)。
@agstudy和@Julius的答案涉及(長) lis
對象的循環; 這里是一個替代方案,假設lis
所有元素與vec
長度相同,以允許對未列出的引用進行矢量比較
shortloop <- function(x, lst)
colSums(matrix(unlist(lst) == x, length(x))) == length(x)
與vec
相比, lis
很長時間很快。
longloop <- function(x, lst)
sapply(lst, identical, x)
l1 = rep(lis, 1000)
microbenchmark(shortloop(vec, l1), longloop(vec, l1))
## Unit: microseconds
## expr min lq median uq max neval
## shortloop(vec, l1) 793.009 808.2175 896.299 905.8795 1058.79 100
## longloop(vec, l1) 18732.338 21649.0770 21797.646 22107.7805 24788.86 100
有趣for
是,與lapply
的隱式循環相比,從性能角度來看,使用for
並不是那么糟糕(盡管更復雜且容易出錯)
longfor <- function(x, lst) {
res <- logical(length(lst))
for (i in seq_along(lst))
res[[i]] = identical(x, lst[[i]])
res
}
library(compiler)
longforc = cmpfun(longfor)
microbenchmark(longloop(vec, l1), longfor(vec, l1), longforc(vec, l1))
## Unit: milliseconds
## expr min lq median uq max neval
## longloop(vec, l1) 18.92824 21.20457 21.71295 21.80009 23.23286 100
## longfor(vec, l1) 23.64756 26.73481 27.43815 27.61699 28.33454 100
## longforc(vec, l1) 17.40998 18.28686 20.47844 20.75303 21.49532 100
sapply(lis, identical, vec)
# [1] FALSE TRUE FALSE FALSE FALSE FALSE
基准測試:
l1 <- list(1:1000)[rep(1, 10000)]
v1 <- sample(1000)
AG <- function() sapply(l1,function(x)all(x==v1))
J <- function() sapply(l1, identical, v1)
microbenchmark(AG(), J())
# Unit: milliseconds
# expr min lq median uq max neval
# AG() 76.42732 84.26958 103.99233 111.62671 148.2824 100
# J() 32.14965 37.54198 47.34538 50.93195 104.4036 100
sapply(lis,function(x)all(x==vec))
[1] FALSE TRUE FALSE FALSE FALSE FALSE
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.