繁体   English   中英

R data.table - 删除对应于给定边际的行

[英]R data.table - remove rows corresponding to a given marginal

我有以下问题。 我有一个 data.table 和一个列M的子集。 我在M定义了向量x

library(data.table)
data <- matrix(c(0,0,NA,1,0,1,NA,1,0,0,1,0,1,1,NA,NA,1,0,0,1,0,0,1,1,1,0,0,1,NA,0,1,1,0,1,1,1), byrow = T, ncol = 6, dimnames = LETTERS[1:6])
dt <- data.table(data)
dt
%     A B  C  D  E F
% 1:  0 0 NA  1  0 1
% 2: NA 1  0  0  1 0
% 3:  1 1 NA NA  1 0
% 4:  0 1  0  0  1 1
% 5:  1 0  0  1 NA 0
% 6:  1 1  0  1  1 1

M = LETTERS[2:5]
x <- dt[2,..M]
x
%    B C D E
% 1: 1 0 0 1

我想从dt删除所有行,其中M边际等于x 即行号。 2和4两者Mx在节目期间变化。 给定Mx的结果将是:


   A B  C  D  E F
1: 0 0 NA  1  0 1
2: 1 1 NA NA  1 0
3: 1 0  0  1 NA 0
4: 1 1  0  1  1 1

data.table 反连接

dt[!x, on = M] # also works: dt[!dt[2], on = M]

#    A B  C  D  E F
# 1: 0 0 NA  1  0 1
# 2: 1 1 NA NA  1 0
# 3: 1 0  0  1 NA 0
# 4: 1 1  0  1  1 1

基础R

eq2 <- Reduce('&', lapply(dt[, ..M], function(x) x == x[2]))

dt[-which(eq2),]
#    A B  C  D  E F
# 1: 0 0 NA  1  0 1
# 2: 1 1 NA NA  1 0
# 3: 1 0  0  1 NA 0
# 4: 1 1  0  1  1 1

不是真正的data.table选项,但使用base R你可以:

data[rowSums(sweep(data[, M], 2, FUN = `==`, x), na.rm = TRUE) != length(x), ]

     A B  C  D  E F
[1,] 0 0 NA  1  0 1
[2,] 1 1 NA NA  1 0
[3,] 1 0  0  1 NA 0
[4,] 1 1  0  1  1 1

另一个基本的 R 解决方案

> subset(dt,!data.frame(t(dt[,..M])) %in% data.frame(t(x)))
   A B  C  D  E F
1: 0 0 NA  1  0 1
2: 1 1 NA NA  1 0
3: 1 0  0  1 NA 0
4: 1 1  0  1  1 1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM