熊猫：在DataFrame中创建汇总列

Question

以下面的DataFrame为例，

In [83]:
df = pd.DataFrame({'A':[1,1,2,2],'B':[1,2,1,2],'values':np.arange(10,30,5)})
df
Out[83]:
   A  B  values
0  1  1      10
1  1  2      15
2  2  1      20
3  2  2      25

生成一个新列的简单方法是什么？该列包含某一列中的某些数据聚合？

例如，如果我对A各项的values求和

In [84]:
df.groupby('A').sum()['values']
Out[84]:
A
1    25
2    45
Name: values

我怎样才能得到

   A  B  values  sum_values_A
0  1  1      10            25
1  1  2      15            25
2  2  1      20            45
3  2  2      25            45

Answer 1

In [20]: df = pd.DataFrame({'A':[1,1,2,2],'B':[1,2,1,2],'values':np.arange(10,30,5)})

In [21]: df
Out[21]:
   A  B  values
0  1  1      10
1  1  2      15
2  2  1      20
3  2  2      25

In [22]: df['sum_values_A'] = df.groupby('A')['values'].transform(np.sum)

In [23]: df
Out[23]:
   A  B  values  sum_values_A
0  1  1      10            25
1  1  2      15            25
2  2  1      20            45
3  2  2      25            45

Answer 2

我找到了一种使用join的方法：

In [101]:
aggregated = df.groupby('A').sum()['values']
aggregated.name = 'sum_values_A'
df.join(aggregated,on='A')

Out[101]:
   A  B  values  sum_values_A
0  1  1      10            25
1  1  2      15            25
2  2  1      20            45
3  2  2      25            45

有人有更简单的方法吗？

Answer 3

这不是那么直接，但是我发现它非常直观（使用map从另一个列创建新列），并且可以应用于许多其他情况：

gb = df.groupby('A').sum()['values']

def getvalue(x):
    return gb[x]

df['sum'] = df['A'].map(getvalue)
df

Answer 4

In [15]: def sum_col(df, col, new_col):
   ....:     df[new_col] = df[col].sum()
   ....:     return df

In [16]: df.groupby("A").apply(sum_col, 'values', 'sum_values_A')
Out[16]: 
   A  B  values  sum_values_A
0  1  1      10            25
1  1  2      15            25
2  2  1      20            45
3  2  2      25            45

熊猫：在DataFrame中创建汇总列

问题描述

4 个解决方案

解决方案1
36 已采纳 2012-11-06 19:07:38

解决方案2
6 2012-11-06 18:36:37

解决方案3
3 2012-11-06 18:49:45

解决方案4
3 2012-11-06 21:26:44

熊猫：在DataFrame中创建汇总列

问题描述

4 个解决方案

解决方案1 36 已采纳 2012-11-06 19:07:38

解决方案2 6 2012-11-06 18:36:37

解决方案3 3 2012-11-06 18:49:45

解决方案4 3 2012-11-06 21:26:44

解决方案1
36 已采纳 2012-11-06 19:07:38

解决方案2
6 2012-11-06 18:36:37

解决方案3
3 2012-11-06 18:49:45

解决方案4
3 2012-11-06 21:26:44