r聚合數據幀：某些列未更改，某些列已聚合

Question

我試圖查看手冊進行匯總，應用等操作，但是找不到通過應用的函數跳過某些列而將其他列原樣復制的示例。 例：

> olddf = data.frame(code=c("one","one","two"), val1=c(1,2,3), val2=c(4,5,6), val3=c(7,8,9))
> olddf
  code val1 val2 val3
1  one    1    4    7
2  one    2    5    8
3  two    3    6    9
>

如何聚合olddf，以便獲得新的數據框，其中：

代碼列保持原樣 ，
val1被跳過
val2通常是聚合的，例如sum （）
然后根據較早的聚合之一創建新列 ...例如，新列= sum（val3）/ sum（val2）？

我基本上想要：

> newdf
  code val2 newcol
1  one    9 1.6666
2  two    6 1.5000

我想一步來做，而不是定義一個單獨的函數來處理每個列/聚合。 這可能嗎？

Answer 1

試試data.table

library(data.table)
setDT(olddf)[, .(val2 = sum(val2),
                 newcol = sum(val3)/sum(val2)), by = code]
#    code val2   newcol
# 1:  one    9 1.666667
# 2:  two    6 1.500000

Answer 2

您可以分兩步執行此操作，關鍵是使用聚合函數。 在by（）參數中，您想要指定聚合方式。 在這種情況下，請根據“代碼”中的值進行匯總。 然后，僅通過指定感興趣的功能添加第三列。

aggregate <- aggregate(olddf[, c("val2", "val3")], by = list(olddf$code), FUN = sum)
aggregate$newcol <- aggregate$val3/aggregate$val2

r聚合數據幀：某些列未更改，某些列已聚合

問題描述

2 個解決方案

解決方案1
2 已采納 2015-02-13 23:04:11

解決方案2
0 2015-02-13 21:42:00

r聚合數據幀：某些列未更改，某些列已聚合

問題描述

2 個解決方案

解決方案1 2 已采納 2015-02-13 23:04:11

解決方案2 0 2015-02-13 21:42:00

解決方案1
2 已采納 2015-02-13 23:04:11

解決方案2
0 2015-02-13 21:42:00