熊貓Groupby條件過濾

Question

我有一個類似下面的大數據框。 我想對Groupby“帳戶”進行分組，讓Groupby僅保留那些在組中具有“等級”的組（該“帳戶”組中的至少一條記錄的“等級”大於0）。
在此示例中，按“帳戶”分組后，只剩下四個組（1、3、4、5）。

如何在熊貓中做到這一點？

store = {'account': ['1', '1', '2', '2', '3', '4', '5'],
    'sales': [150, 200, 50,100, 125, 250, 300 ],
    'employees': [3, 5, 1,2, 3,5,7 ],
    'grade': [80, 90, '','' ,75, 60,85]}
df = pd.DataFrame(store)
df.groupby(['account'])

Answer 1

聽起來像您想要DataFrameGroupBy.filter ，在您的情況下，它可以簡化為

df.groupby('account').filter(lambda x: any(x.grade))

例如（我稍微修改了您的輸入以涵蓋一些邊緣情況）：

In [14]: df
Out[14]:
  account  employees grade  sales
0       1          3    80    150
1       1          5          200
2       2          1           50
3       2          2    60    100
4       3          3          125
5       4          5    60    250
6       5          7    85    300

In [15]: df.groupby('account').filter(lambda x: any(x.grade))
Out[15]:
  account  employees grade  sales
0       1          3    80    150
1       1          5          200
2       2          1           50
3       2          2    60    100
5       4          5    60    250
6       5          7    85    300

熊貓Groupby條件過濾

問題描述

1 個解決方案

解決方案1
1 已采納 2018-02-11 20:39:42

熊貓Groupby條件過濾

問題描述

1 個解決方案

解決方案1 1 已采納 2018-02-11 20:39:42

解決方案1
1 已采納 2018-02-11 20:39:42