如何在聚合函數中選擇多個列？

Question

我有這樣的數據：

A,B,C,D
1,50,1 ,3.9
2,20,22,1.5
3,10,10,2.3
2,15,11,1.8
1,16,13,4.2

我想將它們按A分組，我將對B和C取mean ，對D求和。
解決方案是這樣的：

df = df.groupby(['A']).agg({
    'B': 'mean', 'C': 'mean', 'D': sum
})

我在問是否有一種方法可以為同一功能選擇多個列，而不是像B和C一樣重復

Answer 1

如果每列最多需要一個聚合，則可以將聚合存儲在dict {func: col_list} ，然后在聚合時將其解壓縮。

d = {'mean': ['B', 'C'], sum: ['D']}

df.groupby(['A']).agg({col: f for f,cols in d.items() for col in cols})
#      B     C    D
#A                 
#1  33.0   7.0  8.1
#2  17.5  16.5  3.3
#3  10.0  10.0  2.3

如何在聚合函數中選擇多個列？

問題描述

1 個解決方案

解決方案1
0 已采納 2019-08-08 19:44:19

如何在聚合函數中選擇多個列？

問題描述

1 個解決方案

解決方案1 0 已采納 2019-08-08 19:44:19

解決方案1
0 已采納 2019-08-08 19:44:19