如何根据条件替换熊猫数据框中的值？

Question

我尝试基于包含条件的列“ C”将不同的公式应用于新列“结果”。 如果C为'add'，那么我想添加X和Y。当C为'mult'时，结果应为X *Y。

df = pd.DataFrame({'X': [0, 1, 2, 3, 4],
                   'Y': [5, 6, 7, 8, 9],
                   'C': ['add', 'add', 'mult', 'mult', 'mult']})
df['result'] = df['X'] * df['Y']

df.loc[df.C =='add', 'result'] = df.loc[df['C'] =='add', 'X'] \
                                 + df.loc[df['C'] =='add', 'Y']
df

我得到的结果是：

      C  X  Y  result
0   add  0  5       5
1   add  1  6       5
2  mult  2  7      14
3  mult  3  8      24
4  mult  4  9      36

我需要的是第一行的“结果”为7

      C  X  Y  result
0   add  0  5       5
1   add  1  6       7
2  mult  2  7      14
3  mult  3  8      24
4  mult  4  9      36

Answer 1

您的代码给出了正确的结果，但是如果您想要直接的方法

df['result'] = df.apply(lambda x :  x['X']+x['Y'] if x['C'] == 'add' else x['X']*x['Y'], axis=1 )

输出：

   X  Y     C  result
0  0  5   add       5
1  1  6   add       7
2  2  7  mult      14
3  3  8  mult      24
4  4  9  mult      36

Answer 2

您的解决方案效果很好，也可以在numpy.where使用此替代numpy.where ：

mask = df.C =='add'
df['result'] = np.where(mask, df['X'] + df['Y'], df['X'] * df['Y'])        
print (df)

   X  Y     C  result
0  0  5   add       5
1  1  6   add       7
2  2  7  mult      14
3  3  8  mult      24
4  4  9  mult      36

如果有更多条件，请使用numpy.select ：

m1 = df.C =='add'
m2 = df.C =='mult'
m3 = df.C =='div'
v1 = df['X'] + df['Y']
v2 = df['X'] * df['Y']
v3 = df['X'] / df['Y']

df['result'] = np.select([m1, m2, m3], [v1, v2, v3])        
print (df)

   X  Y     C     result
0  0  5   add   5.000000
1  1  6   add   7.000000
2  2  7  mult  14.000000
3  3  8  mult  24.000000
4  4  9   div   0.444444

如何根据条件替换熊猫数据框中的值？

问题描述

2 个解决方案

解决方案1
4 已采纳 2019-05-17 09:29:47

解决方案2
2 2019-05-17 09:34:55

如何根据条件替换熊猫数据框中的值？

问题描述

2 个解决方案

解决方案1 4 已采纳 2019-05-17 09:29:47

解决方案2 2 2019-05-17 09:34:55

解决方案1
4 已采纳 2019-05-17 09:29:47

解决方案2
2 2019-05-17 09:34:55