Pandas groupby 聚合多个求和

Question

新手问题。 我想使用两个汇总列来计算 dataframe 列，如下所示：

grouped_columns = df1.groupby(['Parent1', 'Parent2']).agg(Attr_fac = ('Exposure1', 'sum') / ('Exposure2', 'sum'))

不断收到 TypeError: Unsupported operand type(s) for /: 'tuple' 和 'tuple'

Exposure1 和 Exposure2 是从 excel 文件中读取的数值列。 请帮忙，我做错了什么？

Answer 1

你真的不能做('Exposure1', 'sum') / ('Exposure2', 'sum')因此错误。 你可以试试：

grouped_columns = (df1.groupby(['Parent1', 'Parent2'])
                      [['Exposure1','Exposure2']].sum()
                      .assign(Attr_fac=lambda x: x['Exposure1']/x['Exposure2'])
                  )

或groupby().apply() ：

grouped_columns = (df1.groupby(['Parent1', 'Parent2'])
                      .apply(lmabda x: x['Exposure1'].sum()/x['Exposure2'].sum())
                  )

Answer 2

这是罪魁祸首('Exposure1', 'sum') / ('Exposure2', 'sum') 。

在此('Exposure1', 'sum')是一个元组， ('Exposure2', 'sum')是另一个元组。 和/操作没有为元组定义。 请用示例 DataFrame 解释您要实现的目标。

Answer 3

我试图将 Exposure1 的总和值除以 Exposure2 的总和值。 我可以得到 Exposure1 的总和值：grouped_columns = df1.groupby(['Parent1', 'Parent2']).agg(Attr_fac = ('Exposure1', 'sum'))。 我想添加额外的总和列（不像这个）。

Pandas groupby 聚合多个求和

问题描述

3 个解决方案

解决方案1
1 已采纳 2021-04-07 01:50:52

解决方案2
0 2021-04-07 01:54:48

解决方案3
0 2021-04-07 02:20:05

Pandas groupby 聚合多个求和

问题描述

3 个解决方案

解决方案1 1 已采纳 2021-04-07 01:50:52

解决方案2 0 2021-04-07 01:54:48

解决方案3 0 2021-04-07 02:20:05

解决方案1
1 已采纳 2021-04-07 01:50:52

解决方案2
0 2021-04-07 01:54:48

解决方案3
0 2021-04-07 02:20:05