簡體   English   中英

數據框列作為 dplyr R 函數的參數

[英]Data frame column as argument to dplyr R function

我想將列名作為參數傳遞給我創建的使用 dplyr 包的函數。

df = data.frame(grade = c(1,1,1,3,3,5,7,8,8,4),
                score = c(10,20,40,43,56,29,59,37,61,88))

tmp.func = function(df.name, variable.name, year.label){

  require("dplyr")

  df = df.name %>%
    group_by(grade) %>%
    summarise(n = n(),
              M = mean(variable.name),
              SD = sd(variable.name),
              P25 = quantile(variable.name, probs = .25),
              P50 = quantile(variable.name, probs = .50),
              P75 = quantile(variable.name, probs = .75)) %>%
    mutate(grade = as.numeric(as.character(variable.name))) %>%
    arrange(grade) %>%
    dplyr::select(grade,
                  n,
                  M, 
                  SD,
                  P25, 
                  P50, 
                  P75)

  colnames(df) = paste(names(df), ".", year.label, sep = "")

  df

}

tmp = tmp.func(df.name = df, variable.name = "score", year.label = ".1718")

此代碼導致以下錯誤消息。 我必須多次運行相同的函數,因此我需要創建一個可以處理此問題的函數。 有沒有更好的方法來解決這個問題?

Error in (1 - h) * qs[i] : non-numeric argument to binary operator
In addition: There were 12 warnings (use warnings() to see them)

您可以使用enquo!! 再次“取消引用”該表達式。 有關更多信息,請參閱節 @svenhalvorson 建議的不同輸入變量

my_summarise2 <- function(df, expr) {
  expr <- enquo(expr)

  summarise(df,
    mean = mean(!! expr),
    sum = sum(!! expr),
    n = n()
  )
}

用法

my_summarise2(df, score)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM