使用 dplyr 分组和过滤数据管理

Question

取一个简单的数据集

a <- c(1,2,3,4,5,6,7,8)
b <- c(1,2,2,1,2,2,2,2)
c <- c(1,1,1,2,2,2,3,3)
d <- data.frame(a,b,c)

现在我想过滤我的数据，以便我们group_by(c)然后删除没有b=1出现的所有数据。

因此，结果 ( e ) 应该看起来像d但没有底部的两行

我试过使用

e <- d %>%
  group_by(c) %>%
  filter(n(b)>1)

output 应该包含下面绿色的数据并删除红色的数据

在此处输入图像描述

Answer 1

尝试

d %>% 
  group_by(c) %>% 
  filter(any(b == 1))

这使：

#Source: local data frame [6 x 3]
#Groups: c
#
#  a b c
#1 1 1 1
#2 2 2 1
#3 3 2 1
#4 4 1 2
#5 5 2 2
#6 6 2 2

Answer 2

你可以试试

df <- d %>% mutate(test = ifelse((b != 1) == T, 0, 1)) %>% group_by(c) %>% 
            mutate(test = sum(test)) %>% filter(test != 0) %>% select(-test)

产量

使用 dplyr 分组和过滤数据管理

问题描述

2 个解决方案

解决方案1
15 已采纳 2015-06-24 13:06:07

解决方案2
0 2015-06-24 13:24:28

使用 dplyr 分组和过滤数据管理

问题描述

2 个解决方案

解决方案1 15 已采纳 2015-06-24 13:06:07

解决方案2 0 2015-06-24 13:24:28

解决方案1
15 已采纳 2015-06-24 13:06:07

解决方案2
0 2015-06-24 13:24:28