如何根据groupby +最大结果过滤数据框？

Question

我的所有FIFA 19球员都有一个数据框。 我使用分组依据来获得球员水平最高的前10个国家/地区（最好，总体平均水平最高），其中仅包括Dataframe中拥有250个以上球员的国家/地区。

df[df.groupby('Nationality')['Overall'].transform('size') > 250].groupby(['Nationality'])['Overall'].mean().nlargest(10)

现在，我想获取整个数据框，包括所有列，但仅包含前10个国家/地区。 我怎样才能做到这一点？

更新：

创建示例以更好地说明：

import pandas as pd
df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice','Rick'], 
               'income': [40000, 50000, 42000, 10000],
              'country':['Brazil','USA','Brazil','Canada']})

df[df.groupby('country')['income'].transform('size') > 1].groupby(['country'])['income'].mean().nlargest(2)

我只想在此数据框上过滤巴西

Answer 1

您可以使用“前N个”数据框中的country的值来对原始数据框进行子集化。

import pandas as pd
df = pd.DataFrame({'user': ['Bob', 'Jane', 'Alice','Rick'], 
               'income': [40000, 50000, 42000, 10000],
              'country':['Brazil','USA','Brazil','Canada']})

top = df[df.groupby('country')['income'].transform('size') > 1].groupby(['country'])['income'].mean().nlargest(2)

df_top = df.loc[df['country'].isin(top.reset_index()['country'])]

如何根据groupby +最大结果过滤数据框？

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-06-19 17:02:46

如何根据groupby +最大结果过滤数据框？

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-06-19 17:02:46

解决方案1
1 已采纳 2019-06-19 17:02:46