Pandas GroupBy：應用具有兩個參數的函數

Question

通常在使用.apply()方法時，會傳遞一個只接受一個參數的函數。

def somefunction(group):
    group['ColumnC'] == group['ColumnC']**2
    return group

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction)

這里somefunction被應用於每個group ，然后返回。 基本上我在這里使用這個例子。

我希望能夠事先不指定列名ColumnC 。 將它作為某種函數的參數somefunction將使代碼更加靈活。

def somefunction(group, column_name):
    group[column_name] == group[column_name]**2
    return group

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction)

有沒有辦法讓這項工作？ 我無法將group傳遞給somefunction ，因為這是由背景中的.apply()神奇地完成的。

Answer 1

你可以通過apply傳遞關鍵字參數

df.groupby(['ColumnA', 'ColumnB']).apply(somefunction, column_name='col')

MCVE

df = pd.DataFrame(dict(A=list(range(2)) * 5, B=range(10)[::-1]))

def f(df, arg1):
    return df * arg1

df.groupby('A').apply(f, arg1=3)

   A   B
0  0  27
1  3  24
2  0  21
3  3  18
4  0  15
5  3  12
6  0   9
7  3   6
8  0   3
9  3   0

Answer 2

你可以創建一個匿名函數

df.groupby(['ColumnA', 'ColumnB']).apply(lambda x: somefunction(x, 'col'))

Pandas GroupBy：應用具有兩個參數的函數

問題描述

2 個解決方案

解決方案1
9 已采納 2017-04-25 16:17:04

解決方案2
1 2017-04-25 16:19:59

Pandas GroupBy：應用具有兩個參數的函數

問題描述

2 個解決方案

解決方案1 9 已采納 2017-04-25 16:17:04

解決方案2 1 2017-04-25 16:19:59

解決方案1
9 已采納 2017-04-25 16:17:04

解決方案2
1 2017-04-25 16:19:59