R：根据行值删除列

Question

做了一些研究，但无法找到我的简单问题的直接答案。 我有一个像这样的数据表：

var1<-sample(12:43,5,replace=T)
var2<-sample(5:20,5,replace=T)
var3<-rep(0, 5)
var4<-sample(2:6,5,replace=T)
var5<-rep(0,5)
df<-data.table(var1,var2,var3,var4,var5)

     var1 var2 var3 var4 var5
1:   36   14    0    2    0
2:   43   19    0    6    0
3:   20    6    0    6    0
4:   41   17    0    2    0
5:   32    8    0    6    0

我想删除仅包含0个值的所有列。 这将生成逻辑向量。

a<-df[,(df[20,]) != 0]

如何使用逻辑向量对数据进行子集？

Answer 1

使用dplyr

var1<-sample(12:43,5,replace=T)
var2<-sample(5:20,5,replace=T)
var3<-rep(0, 5)
var4<-sample(2:6,5,replace=T)
var5<-rep(0,5)
df<-data.frame(var1,var2,var3,var4,var5)

library(dplyr)
# keep only columns for which all line are different from 0
df %>% select_if(function(col) !all(col == 0))
#>   var1 var2 var4
#> 1   13   20    4
#> 2   39   19    6
#> 3   14   20    2
#> 4   35   13    3
#> 5   35   17    4

Answer 2

如果需要data.table方法，请遍历data.table的子集（ lapply(.SD ），检查all值是否均为0， unlist输出，取反（ ! ）并根据逻辑索引对列进行子集化。

 df[, df[, !unlist(lapply(.SD, function(x) all(x==0)))], with = FALSE]

或使用base R ，我们可以Filter var或sum不为0的列。

 Filter(var, df)

R：根据行值删除列

问题描述

2 个解决方案

解决方案1
1 2016-10-27 11:16:22

解决方案2
0 已采纳 2016-10-27 11:09:21

R：根据行值删除列

问题描述

2 个解决方案

解决方案1 1 2016-10-27 11:16:22

解决方案2 0 已采纳 2016-10-27 11:09:21

解决方案1
1 2016-10-27 11:16:22

解决方案2
0 已采纳 2016-10-27 11:09:21