![](/img/trans.png)
[英]How to drop duplicates in one column based on values in 2 other columns in DataFrame in Python Pandas?
[英]Drop duplicates from a panda dataframe based on other column values
我正在使用的 Dataframe 如下:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts
Jan 0 Failed:abcd 4
Jan 4
Jan 4
Jan 4
May 2 Failed:abcFailed:cde 5
May 5
May 1200 5
May 1200 5
May 5
我需要從按“名稱”列分組的“名稱”、“Avg_pass_time”和“RunCounts”列中刪除重復項,以便 output 如下所示:
Name NoOfTrans Avg_pass_time Cons.Error RunCounts
Jan 0 Failed:abcd 4
May 2 1200 Failed:abcFailed:cde 5
任何指南都會有用
您可以 select 將用於刪除重復項的行子集:
df = df.drop_duplicates(subset=['Name','Avg_pass_time','RunCounts'])
未經測試,但這應該有效。
如果每組只有空字符串或重復值,請使用:
df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.