Pandas Groupby-如果多行超過另一行的值，則選擇一列中值最高的行

Question

此操作將DataFrame按兩列進行分組，然后返回ColumnC具有最高值的ColumnC ：

df2 = df.loc[df.groupby(['columnA', 'columnB'], sort=False)['columnC'].idxmax()]

相反，對於每個組中ColumnC > 100所有行，我想采用ColumnD具有最高值的ColumnD 。

我怎樣才能做到這一點？

編輯：

@Code Different在下面的注釋基本上是我要查找的內容，但是我不想排除沒有任何行的ColumnC > 100 ，在這種情況下，我希望在ColumnC具有最高值的ColumnC ，如上面的例子。

Answer 1

通常，我們將數據分為兩部分，然后在條件滿足后進行過濾

df=sort_values('columnD')

df1 = df[df['columnC'] > 100]].drop_duplicates(['columnA', 'columnB'],keep='last')
df2 = df.drop_duplicates(['columnA', 'columnB'],keep='last')

Yourdf=pd.concat([df1,df2]).drop_duplicates(['columnA', 'columnB'])

Pandas Groupby-如果多行超過另一行的值，則選擇一列中值最高的行

問題描述

1 個解決方案

解決方案1
0 2019-09-07 00:23:33

Pandas Groupby-如果多行超過另一行的值，則選擇一列中值最高的行

問題描述

1 個解決方案

解決方案1 0 2019-09-07 00:23:33

解決方案1
0 2019-09-07 00:23:33