[英]R dplyr mutate_at accessing colnames
如何访问dplyr::mutate_at
正在处理的列名?
假设我们想将数据框的一列转换为因子,其级别存储在单独的列表中。
df <- data.frame("C1"=c("A","B","C"), "C2"=c("D","E","F"))
df
C1 C2
1 A D
2 B E
3 C F
lst <- list("C2"=c("F","E","D"), "C3"=c("G","H","I"))
lst
$C2
[1] "F" "E" "D"
$C3
[1] "G" "H" "I"
以下所有触发错误或将所有列值替换为 NA:
df %>%
mutate_at(vars(C2), function(x) factor(x, levels=lst$.))
df %>%
mutate_at(vars(C2), function(x) factor(x, levels=lst[[colnames(.)]]))
df %>%
mutate_at(vars(C2), function(x){col = as.name(.); factor(x, levels=lst$col))
在使用intersect
获取公共列后,您可以在基础purrr
或map2
中使用Map
或 purrr 中的 map2。
cols <- intersect(names(lst), names(df))
df[cols] <- Map(function(x, y) factor(x, levels = y), df[cols], lst[cols])
或者
df[cols] <- purrr::map2(df[cols], lst[cols], ~factor(.x, levels = .y))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.