簡體   English   中英

根據其他列值從熊貓 dataframe 中刪除重復項

[英]Drop duplicates from a panda dataframe based on other column values

我正在使用的 Dataframe 如下:

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
Jan                                                        4
Jan                                                        4
Jan                                                        4
May     2                            Failed:abcFailed:cde  5
May                                                        5
May                  1200                                  5
May                  1200                                  5
May                                                        5

我需要從按“名稱”列分組的“名稱”、“Avg_pass_time”和“RunCounts”列中刪除重復項,以便 output 如下所示:

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
May     2           1200             Failed:abcFailed:cde  5

任何指南都會有用

您可以 select 將用於刪除重復項的行子集:

df = df.drop_duplicates(subset=['Name','Avg_pass_time','RunCounts'])

未經測試,但這應該有效。

如果每組只有空字符串或重復值,請使用:

df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM