[英]Highlighting multiple cells in a row based on other values in the row in a Pandas DataFrame
[英]Pandas assign value to cell based on values of other cells in row
给出以下数据框:
import pandas as pd
import numpy as np
DF = pd.DataFrame({'COL1': ['a','b','b'],
'COL2' : [0,np.nan,1],})
DF
COL1 COL2
0 a 0
1 b NaN
2 b 1
我希望能够为COL1
为b
且COL2
不为空的每一行分配一个值为2
的新列COL3
。
期望的结果如下:
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
提前致谢!
您可以使用numpy.where
与isin
和notnull
:
DF['COL3'] = np.where((DF['COL1'].isin(['b'])) &(DF['COL2'].notnull()), 2, 0)
print DF
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
这可以使用DataFrame上的apply方法来实现。 您需要传入一个函数以应用于每一行并将轴设置为1
以将其设置为正确的模式(应用于每一行,而不是每列)。
这是一个有效的例子:
def row_handler(row):
if row['COL1'] == 'b' and not np.isnan(row['COL2']):
return 2
return 0
DF['COL3'] = DF.apply(row_handler, axis=1)
哪个返回:
>> print DF
COL1 COL2 COL3
0 a 0 0
1 b NaN 0
2 b 1 2
定义一个函数以根据其他列返回值。
def value_handle (row):
if row['COL1'] == 'b' and not pd.isnull(row['COL2']) :
return 2
else:
return 0
然后在引入新列时调用新函数。
DF['COL3'] = DF.apply (lambda row: value_handle (row),axis=1)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.