長數據框中具有公共值的子集列

Question

我有以下數據框：

Group 1 ID A    Value
Group 1 ID B    Value
Group 1 ID C    Value
Group 2 ID B    Value
Group 2 ID C    Value
Group 3 ID B    Value
…   …   …

我正在嘗試使用dplyr獲取組中每個相同ID的平均值（例如，組1，組2和組3中ID B的平均值）。 但是，並非每個組都具有所有ID，因此我想對它進行子集化，以便只計算所有組中的ID。 我知道我可以group_by(dataFrame, group) %>% filter subset %>% group_by(id) %>% mutate(mean)但是我不知道要在過濾器子集中放置什么代碼。

Answer 1

怎么樣

df %>%
  group_by(id) %>%
  mutate(count  = n()) %>%
  filter(count != ngroups) %>% #...

因此，基本上刪除數據框中與未出現在所有組中的ID對應的所有行，然后執行計算。

長數據框中具有公共值的子集列

問題描述

1 個解決方案

解決方案1
0 已采納 2015-07-28 21:57:06

長數據框中具有公共值的子集列

問題描述

1 個解決方案

解決方案1 0 已采納 2015-07-28 21:57:06

解決方案1
0 已采納 2015-07-28 21:57:06