繁体   English   中英

大熊猫保持重复的最高价值

[英]Pandas keep duplicated with highest value

我有类似的数据:

id value duplicate
a   200  yes
a   12   yes
b   42   yes
c   12   no
b   532  yes
b   21   yes
...

为了跟踪重复,我使用df['duplicate'] = df.duplicated('id', keep=False)但是,我想保留具有最高value的那些,并标记或删除其他重复项。 有什么建议么?

啊,我不知道为什么我没想到这个。 df.sort(['id', 'value']) df['is_duplicated'] = df.duplicated('id', keep='first')

抱歉!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM