如何使用 dplyr `across()` 語法過濾全部為 NA 的行？

Question

如果列子集中的所有值都是NA我想過濾我的數據。

我在這里找到了一個適用於所有列的答案，但在這種情況下，我想從過濾器操作中排除“包裝器”列。

library(dplyr)

df <- tibble(a = letters[1:3], b = c(NA, NA, 3), c = c(NA, 2, 3), d = letters[1:3])

# works, but I've lost my surrounding columns

df %>%
  select(-one_of(c("a", "d"))) %>%
  filter_all(any_vars(!is.na(.)))

# only works if all columns are all not NA (or vice versa), I've lost my partially NA rows

df %>%
  filter(across(-one_of(c("a", "d")),
                ~ !is.na(.)))

期望的結果：

> df[2:3,]
# A tibble: 2 x 4
  a         b     c d    
  <chr> <dbl> <dbl> <chr>
1 b        NA     2 b    
2 c         3     3 c

Answer 1

在以前版本的dplyr您可以這樣使用filter_at ：

library(dplyr)

df %>% filter_at(vars(-one_of(c("a", "d"))), any_vars(!is.na(.)))

across沒有直接替換any_vars所以一種方法是在這里使用Reduce ：

df %>% filter(Reduce(`|`, across(-one_of(c("a", "d")),~!is.na(.))))

# A tibble: 2 x 4
#  a         b     c d    
#  <chr> <dbl> <dbl> <chr>
#1 b        NA     2 b    
#2 c         3     3 c

Answer 2

一種選擇可能是：

df %>%
 rowwise() %>%
 filter(sum(!is.na(c_across(-all_of(c("a", "d"))))) != 0)

  a         b     c d    
  <chr> <dbl> <dbl> <chr>
1 b        NA     2 b    
2 c         3     3 c

Answer 3

我在vignette("colwise", package = "dplyr")發現了一個類似的例子

rowAny <- function(x) rowSums(x) > 0
df %>% filter(rowAny(across(-c(a,d), ~ !is.na(.))))

# A tibble: 2 x 4
  a         b     c d    
  <chr> <dbl> <dbl> <chr>
1 b        NA     2 b    
2 c         3     3 c

但我會使用它，因為它更具可讀性：

rowAll <- function(x) rowSums(x) == length(x)
df %>% filter(!rowAll(across(-c(a,d), is.na)))

如何使用 dplyr `across()` 語法過濾全部為 NA 的行？

問題描述

3 個解決方案

解決方案1
4 已采納 2020-09-14 09:20:09

解決方案2
2 2020-09-14 09:20:40

解決方案3
2 2020-09-14 09:34:01

如何使用 dplyr `across()` 語法過濾全部為 NA 的行？

問題描述

3 個解決方案

解決方案1 4 已采納 2020-09-14 09:20:09

解決方案2 2 2020-09-14 09:20:40

解決方案3 2 2020-09-14 09:34:01

解決方案1
4 已采納 2020-09-14 09:20:09

解決方案2
2 2020-09-14 09:20:40

解決方案3
2 2020-09-14 09:34:01