在groupby之后找到具有對應值的nlargest(2)

Question

我有一個如下的數據框：

Datetime             Volume       Price
2020-08-05 09:15:00  1033         504
2020-08-05 09:15:00  1960         516
2020-08-05 09:15:00  1724         520
2020-08-05 09:15:00  1870         540
2020-08-05 09:20:00  1024         576
2020-08-05 09:20:00  1960         548
2020-08-05 09:20:00  1426         526
2020-08-05 09:20:00  1968         518
2020-08-05 09:30:00  1458         511
2020-08-05 09:30:00  1333         534
2020-08-05 09:30:00  1322         555
2020-08-05 09:30:00  1425         567
2020-08-05 09:30:00  1245         598

我想在日期時間列上的 groupby 之后找到具有相應價格的前兩個最大成交量。

結果數據框如下：

Datetime             Volume       Price
2020-08-05 09:15:00  1960         516
2020-08-05 09:15:00  1870         540
2020-08-05 09:20:00  1960         548
2020-08-05 09:20:00  1968         518
2020-08-05 09:30:00  1858         511
2020-08-05 09:30:00  1925         567

Answer 1

在groupby之前使用sort_values ：

print (df.sort_values("Volume", ascending=False)
         .groupby("Datetime").head(2).sort_index())

               Datetime  Volume  Price
1   2020-08-05 09:15:00    1960    516
3   2020-08-05 09:15:00    1870    540
5   2020-08-05 09:20:00    1960    548
7   2020-08-05 09:20:00    1968    518
8   2020-08-05 09:30:00    1458    511
11  2020-08-05 09:30:00    1425    567

Answer 2

使用groupby.rank + boolean indexing ：

df[df.groupby("Datetime")['Volume'].rank(ascending=False).le(2)]

              Datetime  Volume  Price
1   2020-08-05 09:15:00    1960    516
3   2020-08-05 09:15:00    1870    540
5   2020-08-05 09:20:00    1960    548
7   2020-08-05 09:20:00    1968    518
8   2020-08-05 09:30:00    1458    511
11  2020-08-05 09:30:00    1425    567

Answer 3

既然你提到了nlargest

out = df.groupby('Datetime',as_index=False).apply(lambda x : x.nlargest(2, columns=['Volume']))

在groupby之后找到具有對應值的nlargest(2)

問題描述

3 個解決方案

解決方案1
4 2020-09-06 16:17:09

解決方案2
4 2020-09-06 16:26:41

解決方案3
3 已采納 2020-09-06 16:38:27

在groupby之后找到具有對應值的nlargest(2)

問題描述

3 個解決方案

解決方案1 4 2020-09-06 16:17:09

解決方案2 4 2020-09-06 16:26:41

解決方案3 3 已采納 2020-09-06 16:38:27

解決方案1
4 2020-09-06 16:17:09

解決方案2
4 2020-09-06 16:26:41

解決方案3
3 已采納 2020-09-06 16:38:27