[英]pandas - remove duplicated rows in a MultiIndex DataFrame
我需要從df
中刪除具有相同多索引的重復行。
多索引是 [latitude, longitude, AET_date]。
FFDI_daily_max
latitude longitude AET_date
-39.20000076293945312500 140.80000305175781250000 1972-01-20 1.20000004768371582031
1972-01-21 0.89999997615814208984
**1972-01-22** 1.50000000000000000000
**1972-01-22** 1.40000000000000000000
1972-01-23 1.80000000000000000000
1972-01-24 1.40000000000000000000
... ... ... ...
-33.90000152587890625000 150.00000000000000000000 1972-01-20 1.10000004768371582031
1972-01-21 0.49999997615814208984
**1972-01-22** 1.20000000000000000000
**1972-01-22** 1.10000000000000000000
1972-01-23 1.60000000000000000000
1972-01-24 1.60000000000000000000
每個(緯度和經度)在 AET_Date 中有重復的行。 我想要實現的是刪除重復的行並保留具有更高 FFDI_daily_max 的行。
嘗試
df = df.max(level=[0,1,2], axis=0)
或者
df.sort_values('FFDI_daily_max').groupby(level=[0,1,2]).tail(1).sort_index()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.