pandas dataframe 中的逐行替換操作

Question

在給定的數據框中，我正在嘗試執行逐行替換操作，其中 1 應替換為 Values 中的值。

輸入：

import pandas as pd
df = pd.DataFrame({'ID': [1,1,1,2,3,3,4,5,6,7], 
                   'A': [0,1,0,1,0,0,1,0,np.nan,0],
                   'B': [0,0,0,0,1,1,0,0,0,0],
                   'C': [1,0,1,0,0,0,0,0,1,1],
                   'Values': [10, 2, 3,4,9,3,4,5,2,3]})

預期 Output：

   ID   A   B   C   Values
0   1   0.0 0   10  10
1   1   2.0 0   0   2
2   1   0.0 0   3   3
3   2   4.0 0   0   4
4   3   0.0 9   0   9
5   3   0.0 3   0   3
6   4   4.0 0   0   4
7   5   0.0 0   0   5
8   6   NaN 0   2   2
9   7   0.0 0   3   3

**注：數據非常龐大。

Answer 1

使用df.where

 df[['A','B','C']]=df[['A','B','C']].where(df[['A','B','C']].ne(1),df['Values'], axis=0)



ID    A  B   C  Values
0   1  0.0  0  10      10
1   1  2.0  0   0       2
2   1  0.0  0   3       3
3   2  4.0  0   0       4
4   3  0.0  9   0       9
5   3  0.0  3   0       3
6   4  4.0  0   0       4
7   5  0.0  0   0       5
8   6  NaN  0   2       2
9   7  0.0  0   3       3

或者

df[['A','B','C']]=df[['A','B','C']].mask(df[['A','B','C']].eq(1),df['Values'], axis=0)

Answer 2

我的數據真的很大而且很慢。

如果我們利用您的數據集的性質（A、B、C 列有1s或0s或Nans ），您只需對每個列獨立地使用多個df['values'] 。 這應該是超快的，因為它是矢量化的。

df['A'] = df['A']*df['Values']
df['B'] = df['B']*df['Values']
df['C'] = df['C']*df['Values']

print(df)

   ID    A  B   C  Values
0   1  0.0  0  10      10
1   1  2.0  0   0       2
2   1  0.0  0   3       3
3   2  4.0  0   0       4
4   3  0.0  9   0       9
5   3  0.0  3   0       3
6   4  4.0  0   0       4
7   5  0.0  0   0       5
8   6  NaN  0   2       2
9   7  0.0  0   3       3

如果您想明確檢查 A、B、C 的值為 1 的條件（可能是因為這些列的值可能不是 Nans 或 0），那么您可以使用它 -

df[['A','B','C']] = (df[['A','B','C']] == 1)*df[['Values']].values

這將替換原始數據中的 A、B、C 列，但也會將 Nans 替換為 0。

pandas dataframe 中的逐行替換操作

問題描述

2 個解決方案

解決方案1
1 已采納 2021-02-02 22:28:40

解決方案2
0 2021-02-03 20:03:06

pandas dataframe 中的逐行替換操作

問題描述

2 個解決方案

解決方案1 1 已采納 2021-02-02 22:28:40

解決方案2 0 2021-02-03 20:03:06

解決方案1
1 已采納 2021-02-02 22:28:40

解決方案2
0 2021-02-03 20:03:06