[英]Pandas Groupby Conditional Filtering
我有一個類似下面的大數據框。 我想對Groupby“帳戶”進行分組,讓Groupby僅保留那些在組中具有“等級”的組(該“帳戶”組中的至少一條記錄的“等級”大於0)。
在此示例中,按“帳戶”分組后,只剩下四個組(1、3、4、5)。
如何在熊貓中做到這一點?
store = {'account': ['1', '1', '2', '2', '3', '4', '5'],
'sales': [150, 200, 50,100, 125, 250, 300 ],
'employees': [3, 5, 1,2, 3,5,7 ],
'grade': [80, 90, '','' ,75, 60,85]}
df = pd.DataFrame(store)
df.groupby(['account'])
聽起來像您想要DataFrameGroupBy.filter
,在您的情況下,它可以簡化為
df.groupby('account').filter(lambda x: any(x.grade))
例如(我稍微修改了您的輸入以涵蓋一些邊緣情況):
In [14]: df
Out[14]:
account employees grade sales
0 1 3 80 150
1 1 5 200
2 2 1 50
3 2 2 60 100
4 3 3 125
5 4 5 60 250
6 5 7 85 300
In [15]: df.groupby('account').filter(lambda x: any(x.grade))
Out[15]:
account employees grade sales
0 1 3 80 150
1 1 5 200
2 2 1 50
3 2 2 60 100
5 4 5 60 250
6 5 7 85 300
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.