过滤分组的熊猫数据框，保留列中具有最小值的所有行

Question

df = pd.DataFrame([['SAM', 23, 1],
                   ['SAM', 23, 2],
                   ['SAM', 23, 1],
                   ['SAM', 23, 3],
                   ['BILL', 36, 1],
                   ['BILL', 36, 2],
                   ['BILL', 36, 3],
                   ['BILL', 36, 1],
                   ['JIMMY', 33, 4],
                   ['JIMMY', 33, 2],
                   ['JIMMY', 33, 2],
                   ['JIMMY', 33, 3],
                   ['CARTER', 25, 3],
                   ['CARTER', 25, 4],
                   ['CARTER', 25, 5],
                   ['CARTER', 25, 4],
                   ['GRACE', 27, 4],
                   ['GRACE', 27, 5],
                   ['GRACE', 27, 6],
                   ['TOMMY', 32, 7]])
df.columns = ['A', 'B', 'C']

我需要在数据框中保留所有行，其最小值由 'A' 列分组，并保持 B 相同。 这里有几乎相同的主题，但如果我使用

df.loc[df.groupby('A').C.idxmin()]

只剩下最少的一排，我需要所有这些。 预期结果：

Answer 1

让我们尝试使用groupby.transform来获取每组 C 的最小值，并与df['C']进行比较并保持那些等于最小值的C值：

df.loc[df.groupby('A')['C'].transform('min').eq(df['C'])].reset_index(drop=True)

        A   B  C
0     SAM  23  1
1     SAM  23  1
2    BILL  36  1
3    BILL  36  1
4   JIMMY  33  2
5   JIMMY  33  2
6  CARTER  25  3
7   GRACE  27  4
8   TOMMY  32  7

过滤分组的熊猫数据框，保留列中具有最小值的所有行

问题描述

1 个解决方案

解决方案1
2 已采纳 2021-07-15 22:39:19

过滤分组的熊猫数据框，保留列中具有最小值的所有行

问题描述

1 个解决方案

解决方案1 2 已采纳 2021-07-15 22:39:19

解决方案1
2 已采纳 2021-07-15 22:39:19