[英]dplyr - using column names as function arguments
使用數據框,我使用 dplyr 來聚合如下所示的一些列。
> data <- data.frame(a=rep(1:2,3), b=c(6:11))
> data
a b
1 1 6
2 2 7
3 1 8
4 2 9
5 1 10
6 2 11
> data %>% group_by(a) %>% summarize(tot=sum(b))
# A tibble: 2 x 2
a tot
<int> <int>
1 1 24
2 2 27
太棒了。 但是我想為此創建一個可重用的函數,以便可以將列名作為參數傳遞。
查看此處相關問題的答案,我嘗試了以下操作。
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize(tot=sum(colName))
df
}
但是我無法讓它工作。
> sumByColumn(data, "b")
Error in summarise_impl(.data, dots) :
Evaluation error: invalid 'type' (character) of argument.
> sumByColumn(data, b)
Error in summarise_impl(.data, dots) :
Evaluation error: object 'b' not found.
>
這可以使用最新的dplyr
語法(可以在github上看到):
library(dplyr)
library(rlang)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize(tot = sum(!! sym(colName)))
}
sumByColumn(data, "b")
## A tibble: 2 x 2
# a tot
# <int> <int>
#1 1 24
#2 2 27
還有一種將b
指定為變量的替代方法:
library(dplyr)
sumByColumn <- function(df, colName) {
myenc <- enquo(colName)
df %>%
group_by(a) %>%
summarize(tot = sum(!!myenc))
}
sumByColumn(data, b)
## A tibble: 2 x 2
# a tot
# <int> <int>
#1 1 24
#2 2 27
我們可以使用{{}}
:
library(dplyr)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize(tot=sum({{colName}}))
}
sumByColumn(data, b)
# a tot
# <int> <int>
#1 1 24
#2 2 27
dplyr
現在還dplyr
提供了輔助函數( summarise_at
,它接受參數vars
, funs
)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarize_at(vars(colName), funs(tot = sum))
}
提供相同的答案
# A tibble: 2 x 2
# a tot
# <int> <int>
# 1 1 24
# 2 2 27
我們可以使用.data
代詞。
library(dplyr)
sumByColumn <- function(df, colName) {
df %>%
group_by(a) %>%
summarise(tot = sum(.data[[colName]]))
}
sumByColumn(data, "b")
# a tot
#* <int> <int>
#1 1 24
#2 2 27
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.