基于多准则和多列的PANDAS新列

Question

我想使用几个条件和列为一个大表创建一个新列，并且不确定采用哪种最佳方法。

    df = pd.DataFrame({'a': ['A', "B", "B", "C", "D"],
'b':['y','n','y','n', np.nan], 'c':[10,20,10,40,30], 'd':[.3,.1,.4,.2, .1]})
    df.head()

    def fun(df=df):
        df=df.copy()
        if df.a=='A' & df.b =='n': 
            df['new_Col'] = df.c+df.d
        if df.a=='A' & df.b =='y': 
            df['new_Col'] = df.d *2
        else:
            df['new_Col'] = 0
        return df
    fun()

要么


    def fun(df=df):
            df=df.copy()
            if df.a=='A' & df.b =='n': 
                return = df.c+df.d
            if df.a=='A' & df.b =='y': 
                return  df.d *2
            else:
                return 0
    df['new_Col"] df.apply(fun)

或使用np.where ：

    df['new_Col'] = np.where(df.a=='A' & df.b =='n', df.c+df.d,0 )
    df['new_Col'] = np.where(df.a=='A' & df.b =='y', df.d *2,0 )

Answer 1

看起来你需要np.select

a, n, y = df.a.eq('A'), df.b.eq('n'), df.b.eq('y')

df['result'] = np.select([a & n, a & y], [df.c + df.d, df.d*2], default=0)

Answer 2

这是一种算术方式（ 针对情况a = 'A'和b = 'n'我向您的样本添加了另一行 ）：

样品

Out[1369]:
   a    b   c    d
0  A  y    10  0.3
1  B  n    20  0.1
2  B  y    10  0.4
3  C  n    40  0.2
4  D  NaN  30  0.1
5  A  n    50  0.9

nc = df.a.eq('A') & df.b.eq('y')
mc = df.a.eq('A') & df.b.eq('n')
nr = df.d * 2
mr = df.c + df.d

df['new_col'] = nc*nr + mc*mr

Out[1371]:
   a    b   c    d  new_col
0  A  y    10  0.3  0.6
1  B  n    20  0.1  0.0
2  B  y    10  0.4  0.0
3  C  n    40  0.2  0.0
4  D  NaN  30  0.1  0.0
5  A  n    50  0.9  50.9

基于多准则和多列的PANDAS新列

问题描述

2 个解决方案

解决方案1
4 已采纳 2019-08-19 17:31:17

解决方案2
2 2019-08-19 18:35:43

基于多准则和多列的PANDAS新列

问题描述

2 个解决方案

解决方案1 4 已采纳 2019-08-19 17:31:17

解决方案2 2 2019-08-19 18:35:43

解决方案1
4 已采纳 2019-08-19 17:31:17

解决方案2
2 2019-08-19 18:35:43