R-在使用plyr分組的所有功能上應用功能的有效方法

Question

令df為我們的測試數據幀：

set.seed(1)
df <- data.frame(id = c(1,1,2,2,3,3,3),
                 var1 = round(runif(7)),
                 var2 = round(runif(7)),
                 var3 = round(runif(7)))
df

  id var1 var2 var3
1  1    0    1    1
2  1    0    1    0
3  2    1    0    1
4  2    1    0    1
5  3    0    0    0
6  3    1    1    1
7  3    1    0    1

我想總結一下id並總結所有像這樣的值：

df %>% 
  group_by(id) %>% 
  summarise(sum_var_1 = sum(var1),
            sum_var_2 = sum(var2),
            sum_var_3 = sum(var3)) %>% 
  data.frame

  id sum_var_1 sum_var_2 sum_var_3
1  1         0         2         1
2  2         2         0         2
3  3         2         1         2

現在的問題是：是否有一種方法可以避免sum_var_2 = sum(var2) [...]步驟，並在summarise使用諸如公式之類的功能來實現？ 我想總結一下數百個功能！

任何幫助將不勝感激！

Answer 1

由於所有變量都以“ var ”開頭，因此您可以

df %>% 
   group_by(id) %>% 
   summarise_at(vars(starts_with("var")), sum)

返回您的示例。

編輯：@傑克- kaupp評論， summarise_all不工作，甚至更好，也不需要變量名是標准化的：

df %>% 
   group_by(id) %>% 
   summarise_all(sum)

R-在使用plyr分組的所有功能上應用功能的有效方法

問題描述

1 個解決方案

解決方案1
2 已采納 2017-10-10 16:58:43

R-在使用plyr分組的所有功能上應用功能的有效方法

問題描述

1 個解決方案

解決方案1 2 已采納 2017-10-10 16:58:43

解決方案1
2 已采納 2017-10-10 16:58:43