[英]pandas - remove duplicated rows in a MultiIndex DataFrame
我需要从df
中删除具有相同多索引的重复行。
多索引是 [latitude, longitude, AET_date]。
FFDI_daily_max
latitude longitude AET_date
-39.20000076293945312500 140.80000305175781250000 1972-01-20 1.20000004768371582031
1972-01-21 0.89999997615814208984
**1972-01-22** 1.50000000000000000000
**1972-01-22** 1.40000000000000000000
1972-01-23 1.80000000000000000000
1972-01-24 1.40000000000000000000
... ... ... ...
-33.90000152587890625000 150.00000000000000000000 1972-01-20 1.10000004768371582031
1972-01-21 0.49999997615814208984
**1972-01-22** 1.20000000000000000000
**1972-01-22** 1.10000000000000000000
1972-01-23 1.60000000000000000000
1972-01-24 1.60000000000000000000
每个(纬度和经度)在 AET_Date 中有重复的行。 我想要实现的是删除重复的行并保留具有更高 FFDI_daily_max 的行。
尝试
df = df.max(level=[0,1,2], axis=0)
或者
df.sort_values('FFDI_daily_max').groupby(level=[0,1,2]).tail(1).sort_index()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.