如何根据两个或多个其他变量创建pandas dataframe变量/列？

Question

我有一个pandas数据帧，例如：

Col1 Col2
A     1 
B     2
C     3

我理解如何基于Col2的值来创建Col3：

df['Col3'] = (df['Col2'] <= 1).astype(int)

但是......如果新列基于两个变量，如（伪代码）：

if Col2=1 and Col3=1 then Col4='X'
else if Col2=1 and Col3=2 then Col4='Y'
else Col4='Z'

怎么会实现？ 非常感谢

Answer 1

你可以尝试双numpy.where ：

df['Col4'] = np.where((df['Col2'] == 1) & (df['Col3'] == 1), 'X', 
             np.where((df['Col2'] == 1) & (df['Col3'] == 2), 'Y', 'Z'))

样品：

import pandas as pd

df = pd.DataFrame({'Col2': {0: 1, 1: 1, 2: 3}, 
                   'Col1': {0: 'A', 1: 'B', 2: 'C'}, 
                   'Col3': {0: 1, 1: 2, 2: 4}})
print (df)

  Col1  Col2  Col3
0    A     1     1
1    B     1     2
2    C     3     4

df['Col4'] = np.where( (df['Col2'] == 1) & (df['Col3'] == 1), 'X', 
             np.where((df['Col2'] == 1) & (df['Col3'] == 2), 'Y', 'Z'))

print (df)
  Col1  Col2  Col3 Col4
0    A     1     1    X
1    B     1     2    Y
2    C     3     4    Z

使用loc和fillna另一个解决方案，用于填充NaN所有其他值：

df.loc[ (df['Col2'] == 1) & (df['Col3'] == 1) , 'Col4'] =  'X'
df.loc[ (df['Col2'] == 1) & (df['Col3'] == 2) , 'Col4'] =  'Y'
df['Col4'] = df['Col4'].fillna('Z')

print (df)
  Col1  Col2  Col3 Col4
0    A     1     1    X
1    B     1     2    Y
2    C     3     4    Z

Answer 2

您可以使用最终的else值（例如Z ）初始化列，然后检查每个条件：

df['Col4'] = 'Z'
df.loc[(df.Col1 == 1) & (df.Col3 == 1), 'Col4'] = 'X'
df.loc[(df.Col2 == 1) & (df.Col3 == 2), 'Col4'] = 'Y'

如何根据两个或多个其他变量创建pandas dataframe变量/列？

问题描述

2 个解决方案

解决方案1
1 2016-08-16 15:11:32

解决方案2
0 2016-08-16 15:24:49

如何根据两个或多个其他变量创建pandas dataframe变量/列？

问题描述

2 个解决方案

解决方案1 1 2016-08-16 15:11:32

解决方案2 0 2016-08-16 15:24:49

解决方案1
1 2016-08-16 15:11:32

解决方案2
0 2016-08-16 15:24:49