使用匯總和跨 dplyr 按組計算幾列的非`NA`

Question

我想使用summarize和across通過我的分組變量dplyr計算非NA值的數量。 例如，使用這些數據：

library(tidyverse)  
d <- tibble(ID = c(1, 1, 1, 2, 2, 2, 3, 3, 3),
            Col1 = c(5, 8, 2, NA, 2, 2, NA, NA, 1),
            Col2 = c(NA, 2, 1, NA, NA, NA, 1, NA, NA),
            Col3 = c(1, 5, 2, 4, 1, NA, NA, NA, NA))

# A tibble: 9 x 4
     ID  Col1  Col2  Col3
  <dbl> <dbl> <dbl> <dbl>
1     1     5    NA     1
2     1     8     2     5
3     1     2     1     2
4     2    NA    NA     4
5     2     2    NA     1
6     2     2    NA    NA
7     3    NA     1    NA
8     3    NA    NA    NA
9     3     1    NA    NA

解決方案類似於：

d %>%
  group_by(ID) %>%
  summarize(across(matches("^Col[1-3]$"),
                   #function to count non-NA per column per ID
                   ))

結果如下：

# A tibble: 3 x 4
     ID  Col1  Col2  Col3
  <dbl> <dbl> <dbl> <dbl>
1     1     3     2     3
2     2     2     0     2
3     3     1     1     0

Answer 1

我希望這是您正在尋找的：

library(dplyr)

d %>%
  group_by(ID) %>%
  summarise(across(Col1:Col3, ~ sum(!is.na(.x)), .names = "non-{.col}"))

# A tibble: 3 x 4
     ID `non-Col1` `non-Col2` `non-Col3`
  <dbl>      <int>      <int>      <int>
1     1          3          2          3
2     2          2          0          2
3     3          1          1          0

或者，如果您想通過共享字符串 select 列，您可以使用以下命令：

d %>%
  group_by(ID) %>%
  summarise(across(contains("Col"), ~ sum(!is.na(.x)), .names = "non-{.col}"))

使用匯總和跨 dplyr 按組計算幾列的非`NA`

問題描述

1 個解決方案

解決方案1
3 已采納 2021-04-11 00:53:42

使用匯總和跨 dplyr 按組計算幾列的非`NA`

問題描述

1 個解決方案

解決方案1 3 已采納 2021-04-11 00:53:42

解決方案1
3 已采納 2021-04-11 00:53:42