Pandas GroupBy：应用具有两个参数的函数

Question

通常在使用.apply()方法时，会传递一个只接受一个参数的函数。

def somefunction(group):
    group['ColumnC'] == group['ColumnC']**2
    return group

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction)

这里somefunction被应用于每个group ，然后返回。 基本上我在这里使用这个例子。

我希望能够事先不指定列名ColumnC 。 将它作为某种函数的参数somefunction将使代码更加灵活。

def somefunction(group, column_name):
    group[column_name] == group[column_name]**2
    return group

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction)

有没有办法让这项工作？ 我无法将group传递给somefunction ，因为这是由背景中的.apply()神奇地完成的。

Answer 1

你可以通过apply传递关键字参数

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction, column_name='col')

MCVE

df = pd.DataFrame(dict(A=list(range(2)) * 5, B=range(10)[::-1]))

def f(df, arg1):
    return df * arg1

df.groupby('A').apply(f, arg1=3)

   A   B
0  0  27
1  3  24
2  0  21
3  3  18
4  0  15
5  3  12
6  0   9
7  3   6
8  0   3
9  3   0

Answer 2

你可以创建一个匿名函数

df.groupby(['ColumnA', 'ColumnB']).apply(lambda x: somefunction(x, 'col'))

Pandas GroupBy：应用具有两个参数的函数

问题描述

2 个解决方案

解决方案1
9 已采纳 2017-04-25 16:17:04

解决方案2
1 2017-04-25 16:19:59

Pandas GroupBy：应用具有两个参数的函数

问题描述

2 个解决方案

解决方案1 9 已采纳 2017-04-25 16:17:04

解决方案2 1 2017-04-25 16:19:59

解决方案1
9 已采纳 2017-04-25 16:17:04

解决方案2
1 2017-04-25 16:19:59