dplyr 使用累積方法按組匯總

Question

我有一個這樣的data.frame

dat <- data.frame(id = rep(1:4, each = 4),
                  x = 1:16,
                  y = 16:1)

library(dplyr)

我想為每個id做以下操作

for id 1, do mean(x)/mean(y), 
for id 2, do mean(x)/mean(y) where x and y includes values from id 1 and 2 
for id 3, do mean(x)/mean(y) where x and y includes values from id 1, 2 and 3 
for id 4, do mean(x)/mean(y) where x and y includes values from id 1, 2, 3 and 4

我做了一個傳統的 for 循環來做到這一點

temp.vec <- list()
for(l in sort(unique(dat$id))){
  
  temp.vec[[l]] <- dat %>% 
                   dplyr::filter(id <= l) %>%
                   dplyr::summarise(value = mean(x)/mean(y)) 
  print(l)
}

result <- rbindlist(temp.vec)
result 
value
1: 0.1724138
2: 0.3600000
3: 0.6190476
4: 1.0000000

我可以使用 dplyr 執行此操作嗎？

Answer 1

dat %>%
  group_by(id) %>%
  summarise(mean_x = mean(x), mean_y = mean(y)) %>%
  mutate(result = cumsum(mean_x) / cumsum(mean_y)) %>%
  pluck("result")

dplyr 使用累積方法按組匯總

問題描述

1 個解決方案

解決方案1
3 已采納 2020-07-07 16:14:40

dplyr 使用累積方法按組匯總

問題描述

1 個解決方案

解決方案1 3 已采納 2020-07-07 16:14:40

解決方案1
3 已采納 2020-07-07 16:14:40