Pandas 根据许多其他列的条件逻辑添加一个新列

Question

我有一个像这样的熊猫数据框：

aa bb cc dd ee
a  a  b  b  foo
a  b  a  a  foo
b  a  a  a  bar
b  b  b  b  bar

如果第 1 到第 4 列中的值是a我想添加一个新列

结果是这样的：

aa bb cc dd ee  ff
a  a  b  b  foo a
a  b  a  a  foo a
b  a  a  a  bar a
b  b  b  b  bar b

逻辑是：如果第 1 到第 4 列中的任何一个值是a则列ff是a否则它是b

我可以定义一个函数并手动执行每一列，例如：

def some_function(row);
   if row['aa']=='a' or row['bb']=='a' or row['cc']=='a' or row[dd]=='a':
       return 'a'
   return 'b'

但我正在寻找一种可以跨n列扩展的解决方案。

感谢任何帮助！

Answer 1

将numpy.where与eq (==) 创建的条件与any以检查每行至少一个True ：

cols = ['aa','bb','cc', 'dd']
df['ff'] = np.where(df[cols].eq('a').any(1), 'a', 'b')
print (df)
  aa bb cc dd   ee ff
0  a  a  b  b  foo  a
1  a  b  a  a  foo  a
2  b  a  a  a  bar  a
3  b  b  b  b  bar  b

细节：

print (df[cols].eq('a'))
      aa     bb     cc
0   True   True  False
1   True  False   True
2  False   True   True
3  False  False  False

print (df[cols].eq('a').any(1))
0     True
1     True
2     True
3    False
dtype: bool

如果需要自定义功能：

def some_function(row):
   if row[cols].eq('a').any():
       return 'a'
   return 'b'

df['ff'] = df.apply(some_function, 1)
print (df)
  aa bb cc dd   ee ff
0  a  a  b  b  foo  a
1  a  b  a  a  foo  a
2  b  a  a  a  bar  a
3  b  b  b  b  bar  b

Pandas 根据许多其他列的条件逻辑添加一个新列

问题描述

1 个解决方案

解决方案1
4 已采纳 2017-10-18 11:31:52

Pandas 根据许多其他列的条件逻辑添加一个新列

问题描述

1 个解决方案

解决方案1 4 已采纳 2017-10-18 11:31:52

解决方案1
4 已采纳 2017-10-18 11:31:52