繁体   English   中英

Pandas根据行中其他单元格的值为单元格赋值

[英]Pandas assign value to cell based on values of other cells in row

给出以下数据框:

import pandas as pd
import numpy as np
DF = pd.DataFrame({'COL1': ['a','b','b'], 
                   'COL2' : [0,np.nan,1],})

DF

    COL1    COL2
0    a        0      
1    b       NaN     
2    b        1      

我希望能够为COL1bCOL2不为空的每一行分配一个值为2的新列COL3

期望的结果如下:

    COL1    COL2    COL3
0    a        0      0
1    b       NaN     0
2    b        1      2

提前致谢!

您可以使用numpy.whereisinnotnull

DF['COL3'] = np.where((DF['COL1'].isin(['b'])) &(DF['COL2'].notnull()), 2, 0)
print DF 


  COL1  COL2  COL3
0    a     0     0
1    b   NaN     0
2    b     1     2

这可以使用DataFrame上的apply方法来实现。 您需要传入一个函数以应用于每一行并将轴设置为1以将其设置为正确的模式(应用于每一行,而不是每列)。

这是一个有效的例子:

def row_handler(row):
    if row['COL1'] == 'b' and not np.isnan(row['COL2']):
        return 2
    return 0

DF['COL3'] = DF.apply(row_handler, axis=1)

哪个返回:

>> print DF
  COL1  COL2  COL3
0    a     0     0
1    b   NaN     0
2    b     1     2

定义一个函数以根据其他列返回值。

def value_handle (row):
    if row['COL1'] == 'b' and not pd.isnull(row['COL2']) :
    return 2
else:
    return 0

然后在引入新列时调用新函数。

DF['COL3'] = DF.apply (lambda row: value_handle (row),axis=1)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM