[英]Passing a string to an R function and using it as a column name within the function
我有一个 dataframe 和几个科目的学生分数列表(每个科目由一列表示)我想为每个科目(数学、科学和阅读)做下面的计算
avgdata_math <- data%>%
group_by(country) %>%
summarise(ci = list(bootstrap_ci(sex, Math, weight))) %>%
unnest_wider(ci) %>%
ungroup() %>%
mutate(country = fct_reorder(country, avg))
由于我必须重复两次相同的代码,我想编写一个 function 来进行计算(不旋转数据框)
aus_nz <- function(df, subject = "Math") {
df %>%
group_by(country) %>%
summarise(ci = list(bootstrap_ci(sex, subject, weight))) %>%
unnest_wider(ci) %>%
ungroup() %>%
mutate(country = fct_reorder(country, avg))
}
这给了我一个错误,因为我已经将列名(主题)作为字符串传递,然后对数据进行分组,然后在调用 bootstrap_ci function 时使用了字符串值,而它应该是在那里传递的一列数据(应该是分组操作后)。
在 function 中使用:: rlang::ensym(subject)
应该可以工作。
aus_nz <- function(df, subject = "Math") {
df %>%
group_by(country) %>%
summarise(ci = list(bootstrap_ci(sex, !! rlang::ensym(subject), weight))) %>%
unnest_wider(ci) %>%
ungroup() %>%
mutate(country = fct_reorder(country, avg))
}
更新
如果您还想将分组变量作为字符串传递到 function 中,并且如果您有时想要分组的变量不止一个,那么使用!!!
, rlang::ensyms()
和 ellipsis ...
参数可以解决问题,如果不是你的 function 的最后一行。 fct_reorder
只需要一个变量。 如果有两个分组变量:你会怎么做? 创建两个新变量并按avg
对每个分组变量重新排序? 查看您的数据也很有帮助(可能使用dput(head(...))
)。
aus_nz <- function(df, subject = "Math", ...) {
group_var <- rlang::ensyms(...)
df %>%
group_by(!!! group_var) %>%
summarise(ci = list(bootstrap_ci(sex, !! rlang::ensym(subject), weight))) %>%
unnest_wider(ci) %>%
ungroup() # %>% last line needs to be fixed
# mutate(grouped_by = fct_reorder(!!! group_var, avg))
}
如果您不想使用 ellipsis 参数,则可以使用rlang::syms
和一个字符向量(带有一个或多个元素):
aus_nz <- function(df, subject = "Math", group = "country") {
group_var <- rlang::syms(group)
df %>%
group_by(!!! group_var) %>%
summarise(ci = list(bootstrap_ci(sex, !! rlang::ensym(subject), weight))) %>%
unnest_wider(ci) %>%
ungroup() # %>% last line needs to be fixed
# mutate(grouped_by = fct_reorder(!!! group_var, avg))
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.