根據其他列值從熊貓 dataframe 中刪除重復項

Question

我正在使用的 Dataframe 如下：

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
Jan                                                        4
Jan                                                        4
Jan                                                        4
May     2                            Failed:abcFailed:cde  5
May                                                        5
May                  1200                                  5
May                  1200                                  5
May                                                        5

我需要從按“名稱”列分組的“名稱”、“Avg_pass_time”和“RunCounts”列中刪除重復項，以便 output 如下所示：

Name    NoOfTrans   Avg_pass_time    Cons.Error            RunCounts
Jan     0                            Failed:abcd           4
May     2           1200             Failed:abcFailed:cde  5

任何指南都會有用

Answer 1

您可以 select 將用於刪除重復項的行子集：

df = df.drop_duplicates(subset=['Name','Avg_pass_time','RunCounts'])

未經測試，但這應該有效。

Answer 2

如果每組只有空字符串或重復值，請使用：

df = df.replace('',np.nan).groupby('Name', as_index=False).first().fillna('')

根據其他列值從熊貓 dataframe 中刪除重復項

問題描述

2 個解決方案

解決方案1
0 2022-09-30 08:16:30

解決方案2
0 已采納 2022-09-30 08:19:18

根據其他列值從熊貓 dataframe 中刪除重復項

問題描述

2 個解決方案

解決方案1 0 2022-09-30 08:16:30

解決方案2 0 已采納 2022-09-30 08:19:18

解決方案1
0 2022-09-30 08:16:30

解決方案2
0 已采納 2022-09-30 08:19:18