R数据表按组遗漏平均值

Question

我正在寻找一种有效的解决方案，最好是在data.table中，以按组计算遗漏均值。 准确地说，对于id的每个值，我想计算每个组中剩余 id 值的平均值。 以下示例说明了我想要的内容：

group id value desired_output
a     1   10   17.5
a     2   15   15
a     3   20   12.5
b     4   10   20
b     4   15   20
b     5   20   12.5

df <- structure(list(group = c("a", "a", "a", "b", "b", "b"), id = c(1, 
2, 3, 4, 4, 5), value = c(10, 15, 20, 10, 15, 20)), class = "data.frame", row.names = c(NA, 
-6L))

我怎样才能做到这一点？

Answer 1

考虑均值的定义：

df[, ":="(sum_group = sum(value), n_group = .N), by = group]

df[, desired_output := (sum_group - sum(value)) / (n_group - .N), by = id]

#     group    id value sum_group n_group desired_output
#    <char> <num> <num>     <num>   <int>          <num>
# 1:      a     1    10        45       3           17.5
# 2:      a     2    15        45       3           15.0
# 3:      a     3    20        45       3           12.5
# 4:      b     4    10        45       3           20.0
# 5:      b     4    15        45       3           20.0
# 6:      b     5    20        45       3           12.5

R数据表按组遗漏平均值

问题描述

1 个解决方案

解决方案1
3 已采纳 2022-07-04 11:38:17

R数据表按组遗漏平均值

问题描述

1 个解决方案

解决方案1 3 已采纳 2022-07-04 11:38:17

解决方案1
3 已采纳 2022-07-04 11:38:17