繁体   English   中英

dplyr的函数,其参数默认为“。”

[英]function for dplyr with argument that defaults to “.”

假设我想将tibble中的所有列相加以创建一个名为“total”的新列。 我可以:

library(tibble)
library(dplyr)

set.seed(42)
N <- 10
Df <- tibble(p_1 = rnorm(N),
             p_2 = rnorm(N),
             q_1 = rnorm(N),
             q_2 = rnorm(N))

# Works fine
Df %>% mutate(total = apply(., 1, sum))

我可以像这样制作一个帮助函数,

myfun <- function(Df){
  apply(Df, 1, sum)
}

# Works fine
Df %>% mutate(total = myfun(.))

但是,让我们说这个myfun通常会以这种方式使用,即在dplyr动词函数中,然后是“。”。 引用数据框是一个但是多余的,如果myfun函数可以用默认值替换它,那将会很好。 我想要这样的事情:

myfun2 <- function(Df=.){
   apply(Df, 1, sum)
}

这不起作用。

Df %>% mutate(total = myfun2())
Error in mutate_impl(.data, dots) : 
 Evaluation error: object '.' not found.

因为我甚至不确定“。” 工作,我不认为我可以更好地表达问题,但基本上,我想知道是否有一种方式说,实际上,如果未在myfun2定义Df ,获取通常由引用的数据帧“”?

一种选择是quote该功能,然后评估!!

library(tidyverse)
myfun <- function() {
   quote(reduce(., `+`))
}

r1 <- Df %>% 
          mutate(total = !! myfun())
r1
# A tibble: 10 x 5
#       p_1    p_2    q_1     q_2  total
#     <dbl>  <dbl>  <dbl>   <dbl>  <dbl>
# 1  1.37    1.30  -0.307  0.455   2.82 
# 2 -0.565   2.29  -1.78   0.705   0.645
# 3  0.363  -1.39  -0.172  1.04   -0.163
# 4  0.633  -0.279  1.21  -0.609   0.960
# 5  0.404  -0.133  1.90   0.505   2.67 
# 6 -0.106   0.636 -0.430 -1.72   -1.62 
# 7  1.51   -0.284 -0.257 -0.784   0.186
# 8 -0.0947 -2.66  -1.76  -0.851  -5.37 
# 9  2.02   -2.44   0.460 -2.41   -2.38 
#10 -0.0627  1.32  -0.640  0.0361  0.654

请注意, reduce用于更多地与tidyverse对齐,但OP的功能也tidyverse并获得相同的结果

myfun2 <- function() {
   quote(apply(., 1,  sum ))
}

r2 <- Df %>%
        mutate(total = !! myfun2())
all.equal(r2$total, r1$total)
#[1] TRUE

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM