更有效地替換 Pandas Dataframe 中多列的值

Question

我有一個 DataFrame, df ，我想在其中替換幾個值

用戶 1	用戶 2	用戶 3
蘋果	喲	蘋果
芒果	內存	芒果

而不是做


df['user1'] = df['user1'].replace(['apple','mango'], [0, 1])
df['user3'] = df['user1'].replace(['apple','mango'], [0, 1])
df['user2'] = df['user2'].replace(['yoo','ram'], [2, 3])

得到最終的DataFrame

用戶 1	用戶 2	用戶 3
0	2	0
1	3	1

有什么方法可以使上面的代碼更有效，以便我可以用一行代碼更改 apple、mango、yoo 和 ram 的值？

Answer 1

如果需要按每列的唯一值設置范圍，請使用：

cols = ['user1','user2','user3']
s = df[cols].unstack()
df[cols] = pd.Series(pd.factorize(s)[0], index=s.index).unstack(0)
print (df)
   user1  user2  user3
0      0      2      0
1      1      3      1

更有效地替換 Pandas Dataframe 中多列的值

問題描述

1 個解決方案

解決方案1
0 已采納 2021-11-12 13:18:52

更有效地替換 Pandas Dataframe 中多列的值

問題描述

1 個解決方案

解決方案1 0 已采納 2021-11-12 13:18:52

解決方案1
0 已采納 2021-11-12 13:18:52