使用 dplyr 计算与组平均值的差异

Question

I want to calculate the difference each row has from its group's mean.我想计算每行与其组平均值的差异。 Is there a way to do this without creating an intermediate table and joining it?有没有办法在不创建中间表并加入它的情况下做到这一点？

group_summary <- mtcars %>%
  group_by(cyl) %>%
  summarize(mean_mpg = mean(mpg))

left_join(mtcars, group_summary) %>%
  mutate(mpg_diff_from_group = mpg - mean_mpg)

Answer 1

Yes, the following works without intermediate table:是的，以下工作没有中间表：

mtcars %>%
    group_by(cyl) %>%
    mutate(grouped_diff = mpg - mean(mpg)) %>%
    ungroup()

Answer 2

mtcars  %>% group_by(cyl)   %>% mutate(mean_mpg = mean(mpg), mpg_diff_from_grp= mpg - mean_mpg)  %>% ungroup()

Answer 3

similar to the previous codes, instead of using mutate you can also summarize the data and then ungroup again与前面的代码类似，您也可以对数据进行汇总，然后再次取消分组，而不是使用 mutate

mtcars %>%
  group_by(cyl) %>%
  summarise(grouped_diff = mpg - mean(mpg)) %>%
  ungroup

使用 dplyr 计算与组平均值的差异

问题描述

3 个解决方案

解决方案1
3 已采纳 2021-03-25 16:30:06

解决方案2
0 2021-03-25 16:31:08

解决方案3
0 2021-03-26 11:57:50

使用 dplyr 计算与组平均值的差异

问题描述

3 个解决方案

解决方案1 3 已采纳 2021-03-25 16:30:06

解决方案2 0 2021-03-25 16:31:08

解决方案3 0 2021-03-26 11:57:50

解决方案1
3 已采纳 2021-03-25 16:30:06

解决方案2
0 2021-03-25 16:31:08

解决方案3
0 2021-03-26 11:57:50