[英]Dplyr function with optional default argument and required ellipiss
我有一个简单的函数,可以为变量的唯一组合添加计数:
# Add tally summary for group
add_tally <- function(df, n = "n", ...) {
# Grpup variables
group_vars <- rlang::quos(...)
# Check if ellipsis is empty
if (length(group_vars) == 0) {
stop("Missing grouping variables")
}
none <- Negate(any)
# Check that passed object is data frame or tibble
if (none(tibble::is_tibble(df), is.data.frame(df))) {
stop("Passed object should be a data frame or tibble.")
}
if (hasArg("n")) {
# Take varname
varname <- n
} else {
varname <- "n"
}
df %>%
group_by(!!!group_vars, add = TRUE) %>%
mutate(!!varname := sum(n())) %>%
ungroup()
}
这很简单:
>> mtcars[,c("am", "gear")] %>% add_tally(n = "my_n", am,gear)
# A tibble: 32 x 3
am gear my_n
<dbl> <dbl> <int>
1 1.00 4.00 8
2 1.00 4.00 8
3 1.00 4.00 8
4 0 3.00 15
5 0 3.00 15
6 0 3.00 15
7 0 3.00 15
8 0 4.00 4
9 0 4.00 4
10 0 4.00 4
我希望n
参数是可选的。 即,如果未显式定义(如my_n
的示例中的my_n
),则我希望该参数采用默认的n
值。 就像通常在n = "n"
发生的那样,由于尝试hasArgs()
调用,因此现在是多余的。
这将失败:
>> mtcars[,c("am", "gear")] %>% add_tally(am,gear)
Error in add_tally(., am, gear) : object 'am' not found
# A tibble: 32 x 3
am gear n
<dbl> <dbl> <int>
1 1.00 4.00 8
2 1.00 4.00 8
3 1.00 4.00 8
4 0 3.00 15
5 0 3.00 15
6 0 3.00 15
7 0 3.00 15
8 0 4.00 4
9 0 4.00 4
10 0 4.00 4
您需要更改参数的顺序,以便您给定的第二个参数(如果未命名)不会被解释为n
值。
add_tally <- function(df, ..., n = "n") {
#function code
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.