使用 python 在 csv 文件中添加列時刪除重復項

Question

我有一個看起來像這樣的 CSV 文件：

|innings |     bowler    |
|--------|---------------|                      
|1       |      P Kumar  |
|1       |      P Kumar  |
|1       |      P Kumar  |
|1       |      P Kumar  |
|1       |      Z Khan   |
|1       |      Z Khan   |
|1       |      Z Khan   |
|2       |      AB Dinda |
|2       |      AB Dinda |
|2       |      I Sharma |

所需 Output

|innings |     bowler           |
|--------|----------------------|
|1       |    P Kumar,Z Khan    |
|2       |    AB Dinda,I Sharma |

我應用的代碼：

df.groupby(['innings']).bowler.sum().drop_duplicates(subset="bowler",keep='first',inplace=True)

但由於某種原因，它給了我一個錯誤 TypeError: drop_duplicates() got an unexpected keyword argument 'subset'

然后我嘗試不使用子集： drop_duplicates("bowler",keep='first', inplace=True) 現在我收到此錯誤 TypeError: drop_duplicates() got multiple values for argument 'keep'

Answer 1

兩列首先使用DataFrame.drop_duplicates然后聚合join ：

df = (df.drop_duplicates(subset=["bowler",'innings'])
        .groupby('innings')
        .bowler.agg(','.join)
        .reset_index())

print (df)
   innings             bowler
0        1     P Kumar,Z Khan
1        2  AB Dinda,I Sharma

使用 python 在 csv 文件中添加列時刪除重復項

問題描述

1 個解決方案

解決方案1
0 2021-04-21 07:41:21

使用 python 在 csv 文件中添加列時刪除重復項

問題描述

1 個解決方案

解決方案1 0 2021-04-21 07:41:21

解決方案1
0 2021-04-21 07:41:21