[英]Calculate difference from the group mean using dplyr
我想计算每行与其组平均值的差异。 有没有办法在不创建中间表并加入它的情况下做到这一点?
group_summary <- mtcars %>%
group_by(cyl) %>%
summarize(mean_mpg = mean(mpg))
left_join(mtcars, group_summary) %>%
mutate(mpg_diff_from_group = mpg - mean_mpg)
是的,以下工作没有中间表:
mtcars %>%
group_by(cyl) %>%
mutate(grouped_diff = mpg - mean(mpg)) %>%
ungroup()
mtcars %>% group_by(cyl) %>% mutate(mean_mpg = mean(mpg), mpg_diff_from_grp= mpg - mean_mpg) %>% ungroup()
与前面的代码类似,您也可以对数据进行汇总,然后再次取消分组,而不是使用 mutate
mtcars %>%
group_by(cyl) %>%
summarise(grouped_diff = mpg - mean(mpg)) %>%
ungroup
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.