如何过滤掉 Tidyverse 中 1 列为空的组

Question

tibble(
  A = c("A","A","B","B"),
  x = c(NA,NA,NA,1),
  y = c(1,2,3,4),
) %>% group_by(A) -> df

所需 output：

tibble(
  A = c("B","B"),
  x = c(NA,1)
  y = c(3,4),
)

我想找到所有x和x的所有元素都是NA的组，然后删除这些组。 "B"被过滤掉，因为它至少有 1 个非NA元素。

我试过了：

df %>%
  filter(all(!is.na(x)))

但如果它发现至少 1 个 NA，它似乎会被过滤掉； 我需要正确的词，不是all 。

Answer 1

如果x的所有元素都是NA ，这将删除列A组：

library(dplyr)

df %>%
  group_by(A) %>%
  filter(! all(is.na(x)))

# A tibble: 2 × 3
# Groups:   A [1]
#  A         x     y
#  <chr> <dbl> <dbl>
#1 B        NA     3
#2 B         1     4

请注意，组"A"已被删除，因为x列中的两个单元格均未定义。

Answer 2

我们可以使用any with complete.cases

library(dplyr)
df %>% 
  group_by(A) %>% 
  filter(any(complete.cases(x))) %>% 
  ungroup

-输出

# A tibble: 2 × 3
  A         x     y
  <chr> <dbl> <dbl>
1 B        NA     3
2 B         1     4

在dplyr的devel版本中，我们可以在filter中使用.by因此我们不需要group_by/ungroup

df %>%  
  filter(any(complete.cases(x)), .by = 'A')
# A tibble: 2 × 3
  A         x     y
  <chr> <dbl> <dbl>
1 B        NA     3
2 B         1     4

如何过滤掉 Tidyverse 中 1 列为空的组

问题描述

2 个解决方案

解决方案1
2 已采纳 2023-01-07 13:45:23

解决方案2
1 2023-01-07 16:51:06

如何过滤掉 Tidyverse 中 1 列为空的组

问题描述

2 个解决方案

解决方案1 2 已采纳 2023-01-07 13:45:23

解决方案2 1 2023-01-07 16:51:06

解决方案1
2 已采纳 2023-01-07 13:45:23

解决方案2
1 2023-01-07 16:51:06