計算按列號分組的平均值

Question

我有兩個數據df_value和df_num 。 df_num具有兩列： row和col ，它們是df_value中滿足特定條件的值的行號和列號。 我想按df_num的col計算均值組。

我被卡在組col 。

df_value<- data.frame('a'=1:3,'b'=2:4,'c'=1:3,'d'=3:5)
df_num <- which(df<4,arr.ind = TRUE)
df_value
a b c d
1 2 1 3
2 3 2 4
3 4 3 5
df_num
row col
1    1
2    1
3    1
1    2
2    2
1    3
2    3
3    3
1    4

我想獲取col1 ， col2 ， col3和col4 ，

mean:
 2
 2.5
 2
 3

Answer 1

如果你必須使用df_num於子集df_val然后取mean列的一種方法是split子集df_value根據"col"的列df_num並采取mean每個列表中。

sapply(split(df_value[df_num], df_num[, "col"]), mean, na.rm = TRUE)

#  1   2   3   4 
#2.0 2.5 2.0 3.0

如評論中所述，您可以直接過濾df_value以取mean

sapply(df_value, function(x) mean(x[x<4], na.rm = TRUE))

#  1   2   3   4 
#2.0 2.5 2.0 3.0

Answer 2

我們可以從base R使用tapply

tapply(df_value[df_num], df_num[, 'col'], FUN = mean)
#  1   2   3   4 
#2.0 2.5 2.0 3.0

計算按列號分組的平均值

問題描述

2 個解決方案

解決方案1
1 已采納 2019-07-19 12:24:53

解決方案2
1 2019-07-19 12:53:37

計算按列號分組的平均值

問題描述

2 個解決方案

解決方案1 1 已采納 2019-07-19 12:24:53

解決方案2 1 2019-07-19 12:53:37

解決方案1
1 已采納 2019-07-19 12:24:53

解決方案2
1 2019-07-19 12:53:37